自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

转载 拼写检查(贝叶斯)

拼写检查(贝叶斯)http://norvig.com/spell-correct.html

2018-10-27 13:49:48 339

转载 Python中实现这五类强大的概率分布

Python中实现这五类强大的概率分布,转载自http://python.jobbole.com/81321/

2018-10-27 13:48:01 448

转载 em算法系列2:推导

这里有篇文章比较不错,不写了,比较好的总结了em算法推导以及3硬币模型推导NLP —— 图模型(零):EM算法简述及简单示例(三硬币模型)

2018-10-05 17:50:25 165

原创 em算法系列1:python实现三硬币模型

三硬币模型假设有3枚硬币,分别记做A,B,C。这些硬币正面出现的概率分别是π,p和q。进行如下掷硬币实验:先掷硬币A,根据其结果选出硬币B或C,正面选B,反面选硬币C;然后投掷选重中的硬币,出现正面记作1,反面记作0;独立地重复n次(n=10),结果为1111110000我们只能观察投掷硬币的结果,而不知其过程,估计这三个参数π,p和q。EM算法可以看到投掷硬币时到底选择了B或者C是未知的...

2018-10-05 14:31:08 2835

转载 随机森林

随机森林随机森林与集成学习的关系:说到随机森林,就不得不提一下机器学习中的集成学习方法.随机性:随机体现在两个方面,生成单颗决策树时,需要进行样本的有放回抽样(自助采样法), 在生成单颗决策树时,每个结点处,进行特征的随机抽样。.out-of-bag估计:每颗决策树的生成都需要自助采样,这时就会有1/3的数据未被选中,这部分数据称为袋外数据。可以根据这部分数据进行 森林泛...

2018-10-01 11:16:05 806

原创 逻辑回归实现

参考<<机器学习实战>>中讲解以及上一章理论推导,我们来深入了解一下。测试数据机器学习实战中给出一个testSet.txt-0.017612 14.053064 0-1.395634 4.662541 1-0.752157 6.538620 0-1.322371 7.152853 00.423363 11.054677 00.406704 7.067335 ...

2018-09-24 17:03:15 410

原创 逻辑回归

线性回归线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。表现形式: f(x)=wTx+b f(x) = w^Tx + b f(x)=wTx+b一般给定一个xxx,可以预测一个数值yyy。为了消除常数项bbb,我们设x,=[1,x]Tx^, = [1,x]^Tx,=[1,x]T ,同时 w,=[b,w]Tw^, = [b,w]^Tw,=[b,...

2018-09-22 12:18:33 132

原创 决策树

概述决策树decision tree是功能强大且相当受欢迎的分类和预测方法。他是基于特征对实例进行分类,他是一种树状结构。 本章中,训练集用DDD,TTT表示一颗决策树。决策树决策树原理决策树是一个贪心算法,即在特性空间上执行递归的二元分割,决策树有节点和有向边组成。内部节点表示一个特征或者属性;叶子节点表示一个分类。 决策树可以表示给定特征条件下,类别的条件概率分布。将特征空...

2018-09-06 21:42:12 261

原创 python 实现感知机

python 实现感知机标签(空格分隔): 机器学习感知机有如下部分: 输入权值 一个感知器可以接收多个输入(x1,x2,...,xn|xi∈R)(x1,x2,...,xn|xi∈R) (x_1,x_2,...,x_n|x_i \in R),每一个输入对应一个权值wi∈Rwi∈Rw_i\in R,此外还有一个偏置项 b∈Rb∈Rb \in R 激活函数f(x)={1,0,x&gt...

2018-09-05 21:02:22 500

原创 python数据预处理

二元化scikit-learn 提供的Binarizer能够将数据二元化from sklearn.preprocessing import BinarizerX = [[1,2,3,4,5], [5,4,3,2,1], [3,3,3,3,3], [1,1,1,1,1]]print("before transform:",X)binarizer=Binar...

2018-09-05 20:29:28 507

原创 数据预处理

数据预处理列表项标签(空格分隔): 数据分析概述工程实践中,获取的数据有缺失值、重复值,需要预处理。下面给出常用流程:去除唯一属性处理缺失值属性编码数据标准化、正则化特征选择主成分分析去除唯一属性给的数据集 D=(x⃗ 1,y1),(x⃗ 2,y2)...,(x⃗ N,yN)D=

2018-09-04 20:25:12 1044

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除