自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Tricks while feature_extracting text: Extend the vectorizer with NLTK's stemmer

This is a reading note from 'Building Machine learning System with Python'.@P59Train_data=           ['This is a toy post about machine learning. Actually, it contains not much interesting stuff.'

2014-08-22 14:00:22 775

原创 An example in sklearn: Faces recognition example using eigenfaces and SVMs

Some basic concept:F1 score:

2014-08-18 10:11:48 996

转载 决策树剪枝的方法与必要性

zhuan1 决策树剪枝的必要性本文讨论的决策树主要是基于ID3算法实现的离散决策树生成。ID3算法的基本思想是贪心算法,采用自上而下的分而治之的方法构造决策树。首先检测训练数据集的所有特征,选择信息增益最大的特征A建立决策树根节点,由该特征的不同取值建立分枝,对各分枝的实例子集递归,用该方法建立树的节点和分枝,直到某一子集中的数据都属于同一类别,或者没有特征可以在用于对数据进行分割。ID

2014-08-16 16:53:23 7147

转载 转贴一篇关于NLTK的中文文章

加载中…小森的拇指书屋http://blog.sina.com.cn/lovelyls[订阅][手机订阅]    这是一篇介绍NLTK的文章,原载于这里,值得一看,唯一不足之处在于作者对于一些名词的解释略显业余,同时对于最新版的NLTK,我们在代码上的实现和原文上还是有些出入的。

2014-08-12 17:10:30 1101

转载 feature_extraction

Cloga的互联网笔记ArchiveCategoriesPagesTags关于Clogasklearn文本特征提取 19 January 2014 文本特征提取词袋(Bag of Words)表征文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长

2014-08-11 09:41:26 1443

转载 python + request + lxml的几个例证

From:   http://www.educity.cn/wenda/81465.html

2014-08-07 14:34:36 1208

转载 python requests的安装与简单运用

From:   http://www.zhidaow.com/post/python-requests-install-and-brief-introduction

2014-08-07 14:32:53 581

转载 HTTP Request header

From   http://www.cnblogs.com/lexus/archive/2012/02/21/2360944.html

2014-08-07 14:27:36 508

转载 Python scikit-learn机器学习工具包学习笔记:feature_selection模块

sklearn.feature_selection模块的作用是featureselection,而不是feature extraction。Univariate featureselection:单变量的特征选择单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标重要。剔除那些不重要的指标。sklearn.feature_selectio

2014-08-07 10:14:40 2652

转载 Python scikit-learn机器学习工具包学习笔记:cross_validation模块

From:http://blog.sina.com.cn/s/blog_6a90ae320101a5rc.htmlsklearn.cross_validation模块的作用顾名思义就是做crossvalidation的。crossvalidation大概的意思是:对于原始数据我们要将其一部分分为train data,一部分分为testdata。train data用

2014-08-07 09:48:40 7740

转载 python中xrange和range的异同

range    函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。range示例: >>> range(5) [0, 1, 2, 3, 4] >>> range(1,5) [1, 2, 3, 4] >>> range(0,6,2)[0, 2, 4]xrange    函数说明

2014-08-06 11:17:35 415

转载 PyMongo基本使用

引用PyMongo>>> import pymongo 创建连接Connection>>> import pymongo>>> conn = pymongo.Connection('localhost',27017)或>>> from pymongo import Connection>>> conn = Connec

2014-08-04 15:03:16 478

原创 The difference between read, readline, readlines in Python

A simple test could clearly illustrate the difference.#

2014-07-22 10:01:58 570

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除