夏决未央-CSDN博客

原创 FP-growth算法应用实例（基于python）

我把关于FP-Growth的算法原理，python实现代码，以及代码解读放在了另外一篇文章：有兴趣可以看看。这篇文章给出该算法的一个很酷的实例应用。我们将用到一个叫 kosarak.dat 的数据集，可以从这里下载。这份数据集包含将近100万条记录，对于展示FP-Growth算法的速度十分有效。该文件的每一行包含某个用户浏览过的新闻报道。用户和报道被编码成整数。为了看起来方便，还是先放一下...

2018-11-05 19:16:27 5971 2

相信大家都听说过“啤酒与尿布“的经典案例，分析人员通过对一家商店大量的商品购买记录进行分析后发现，啤酒与尿布经常一起被购买。这种神奇的组合我们单从肉眼上可能很难发现，这个案例用到的算法就是Apriori算法。该算法能够帮助我们发现频繁项集和挖掘关联规则，频繁项集是指那些经常出现在一起的物品组合。案例中的{啤酒，牛奶}就是频繁项集。关联规则暗示两种物品之间可能存在很强的关系。举个例子说明与Apr...

2018-11-05 14:51:55 1252

原创 FP-growth算法原理及python实现（详细代码解释）

目录算法简介构建FP树挖掘频繁项集算法简介FP-growth算法的应用我们经常接触到。比如，你在百度的搜索框内输入某个字或词，搜索引擎会自动补全查询词项，而这些词项都是和搜索词经常一起出现的。 FP-growth算法被用来挖掘频繁项集，也就是说从已给的多条数据记录中挖掘出哪些项是频繁一起出现的。该算法适用于标称型数据，即离散型数据。它比Apriori算法更高效，因为该算...

2018-11-02 17:11:28 19057 13

原创哈夫曼编码原理了解一下

什么是哈夫曼编码呢？这种编码方法在1952年由美国计算机科学家戴维·哈夫曼先生提出，它是一种数据压缩技术。这是一种很著名的编码方法哦，我们来了解一下吧。为啥说它是一种数据压缩技术呢，这完全因为它的编码思想：根据字符出现的概率大小进行编码，出现概率高的字符使用较短的编码，出现概率低的字符使用较长的编码。我们可以想一下，假设有一段文本，我们要给里面的每个字符都编码，对于一个出现概率很高的字符，如果我们...

2018-06-14 21:27:16 14387 1

转载实验三信道建设

实验的目的和要求了解信道的含义、信源编码的流程，熟练掌握整数、小数的十进制和二进制的互换机制，并能编程实现。考核要求熟悉并掌握十进制与二进制小数的互转机制，并分析算法产生的误差实验内容：1、编写程序实现十进制小数x=0.7 的二进制转换，并分析其误差（即重新将二进制小数转成十进制小数，和原十进制小数进行比较。）2、编程实现十进制数 x=5.9的二进制转换。%%%第一题clear allcl...

2018-06-11 16:44:12 485

转载实验二构建信源模型

实验的目的和要求正确理解信息科学的基本概念——信源；基于给定材料，构建合理的信源数学模型，并用MATLAB完成建模过程。该部分实验涉及数据读入(文档读写、图像读写)、概率统计等等。实验内容：1、随机产生一个一行五列数组，使其恰好符合信源概率的要求；2、基于给定英文材料，以26个英文字母为信源消息符号，构建该信源的数学模型。1）统计26个英文字母出现的频数；2）计算26个英文字母出现的频率，并...

2018-06-10 15:57:53 1789

weixin_42419314的博客

原创 FP-growth算法应用实例（基于python）

原创 Apriori原理及python实现

原创 FP-growth算法原理及python实现（详细代码解释）

原创哈夫曼编码原理了解一下

转载实验三信道建设

转载实验二构建信源模型

空空如也

空空如也

原创 FP-growth算法应用实例（基于python）

原创 Apriori原理及python实现

原创 FP-growth算法原理及python实现（详细代码解释）

原创 哈夫曼编码原理了解一下

转载 实验三 信道建设

转载 实验二 构建信源模型

空空如也

空空如也

原创哈夫曼编码原理了解一下

转载实验三信道建设

转载实验二构建信源模型