自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (6)
  • 问答 (2)
  • 收藏
  • 关注

原创 关联规则-FP Tree

在开始之前首先要说明下构造FP-Tree树的过程及Fp-Tree树涉及的相关概念;@构造FP-Tree树的过程如下:1.按Apriori算法,扫描数据库一次生成1-频繁项目集,并按频度降序排列,放入L列表中;2.创建根节点,标志为Null,扫描数据库一次,当得到数据库的一个项目(元祖)时,就把其他元素按L表中的次序排列,然后通过递归程序实现FP-Tree树的增长;@关于...

2019-07-28 16:50:57 1336

转载 通俗理解LDA主题模型

通俗理解LDA主题模型0 前言    印象中,最开始听说“LDA”这个名词,是缘于rickjin在2013年3月写的一个LDA科普系列,叫LDA数学八卦,我当时一直想看来着,记得还打印过一次,但不知是因为这篇文档的前序铺垫太长(现在才意识到这些“铺垫”都是深刻理解LDA 的基础,但如果没有人帮助初学者提纲挈领、把握主次

2017-03-28 11:46:43 475

转载 LDA主题模型简介-&&-浅谈gibbs sampling(LDA实验)

LDA, Machine Learning

2017-03-24 14:32:50 1024

翻译 【译文】 The Author-Topic Model for Authors and Documents ( Michal Rosen-Zvi, Thomas Griffiths, etc. )

Machine Learning, Data Science and Advanced Analytics

2017-03-23 14:36:35 1833

转载 Author-Topic Model与ACT-LDA分析与解析

Generative Models for Document(文章的生成模型)这里的Document(文章)是包括两部分:文章的作者集合,组成文章内容的单词集合。例如:Document 1表示为:Document 2表示为:

2017-03-21 22:46:51 2738 2

转载 隐马尔可夫模型(HMM)详解

隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下,加深理解,在此特别感谢 52nlp 对 HMM 的详细介绍。  考虑下面交通灯的

2016-09-21 20:07:20 868

原创 centos7.0+下安装adobe flash-player

Description: 之前给python升级后,解决的yum等问题,可是... 后来,升级后安装numpy包,import后运行时..... WTF!!! 显示没有numpy这个宝宝.... 乱搞一通。。可以用了,发现自己的代码在python3.0+下运行是有问题的。。。然后 。。。反正也没什么重要代码,一哥们儿说:“大不了重写呗~!反正我有定期删代码的习惯,重写的时候通常比以前代码感觉更简单

2016-08-25 17:43:34 15112 1

原创 centos下,将python升级3.0+以上版本后,yum、update等无法使用问题

或许有些小伙伴将python升级后,懵比了!!!!!我的yum用不了啦!!!!!!!!解决完yum问题后,发现,哦呵呵呵呵呵呵 原来不止是yum阿。。。。Now~ 我现在给大家上图that how i sloved this problem before~~~~!! *****首先,第一个是yum的问题~what???我的yum用不了!!!别担心 -.- 有LaFee~~

2016-08-12 17:25:04 4158 1

翻译 Detecting Near-Duplicates for Web Crawling

ABSTRACT在网页上有很多相似的文档。比如说,两篇文章只有在显示广告这一小部分是互不相同的。但这些不同的地方,对于网页搜索来说,是无关紧要的。因此,如果该网络爬虫技术可以评估最新抓取的网页与之前抓取的网页是否相似,那么它的“质量(类似..就是升级版!性能提升)”就会提升。在开发一个在数百亿网页栈中检测相似文章的系统过程中,我们做了两项研究贡献。第一个,我们证明了Charikar的指纹识

2016-07-30 09:24:10 1195 1

转载 文档去重算法:SimHash和MinHash

simhash与重复信息识别来源:http://grunt1223.iteye.com/blog/964564在工作学习中,我往往感叹数学奇迹般的解决一些貌似不可能完成的任务,并且十分希望将这种喜悦分享给大家,就好比说:“老婆,出来看上帝”…… 随着信息爆炸时代的来临,互联网上充斥着着大量的近重复信息,有效地识别它们是一个很有意义的课题。例如,对于搜

2016-07-22 19:22:59 845

原创 最优分解(贪心)

Description:设n是一个正整数。现要求将n分解为若干个自然数的和,且使这些自然数的乘积最大。对于给定的正整数n,编程计算最优分解方案。Sample Input:10Sample Output:36analysis:若 a + b = c,则 | a – b | 越小,a × b 越大。根据原问题的描述,需

2015-12-23 08:42:33 853

原创 最小重量机器设计

Description:设某一机器由n个部件组成,每一个部件都可以从m个不同的供应商处购得。设w[i][j]是从供应商j处购得的部件i的重量,c[i][j]是相应的价格。试设计一个算法,给出总价格不超过d的最小重量机器设计。Input:3 3 4 //m, n, d   1 2 3 //c[i][j]3 2 12 2 21 2 3 //w[i][j]3 2 12 2

2015-12-22 15:53:06 673

转载 孤儿进程与僵尸进程[总结]

孤儿进程与僵尸进程[总结]1、前言  之前在看《unix环境高级编程》第八章进程时候,提到孤儿进程和僵尸进程,一直对这两个概念比较模糊。今天被人问到什么是孤儿进程和僵尸进程,会带来什么问题,怎么解决,我只停留在概念上面,没有深入,倍感惭愧。晚上回来google了一下,再次参考APUE,认真总结一下,加深理解。2、基本概念  我们知道在unix/linux中,正常情况下,子进程是

2014-07-26 09:47:08 515

原创 八皇后(c语言)

#include #include #include #include #include #include #include int longitudinal[100];int queen[100][100];bool place (int);     /*找到皇后合适的列位置*/void Queen (int);     /*找到所有皇后合适的位置

2014-07-26 09:26:02 611

原创 双向循环链表(带头结点)

//创建链表-录入信息movie *creat () {    movie *head, *node1, *node2;    char choice;    head = node1 = malloc(N);    head->next = head;    head->pro = head;    printf ("\n PLease input the

2014-07-19 17:19:52 3808

simhash源码

simhash源码

2017-01-12

机器学习实战 pdf

机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。 本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。 全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

2016-07-31

算法设计与分析-上机代码

算法设计与分析上级的源代码哦~ 原创哦~ 老师肯定给A+的 (里面包括:分治法找最大、最小值;;;编辑距离;;;最大K乘积;;;最优分解;;;数字三角形;;;最小机器设计;;;八皇后) PS:我的用的是Dev-c++和Centos 这些代码在这些环境下完全运行成功

2016-07-31

网页设计_关于寿司哒~

网页设计,关于寿司哒 主页 简介 有关于寿司 还有人物的~~

2015-05-29

2048-JAVA版

2048Java版哦 ~~~ 绝对可以运行

2015-05-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除