- 博客(13)
- 收藏
- 关注
原创 Tricks while feature_extracting text: Extend the vectorizer with NLTK's stemmer
This is a reading note from 'Building Machine learning System with Python'.@P59Train_data= ['This is a toy post about machine learning. Actually, it contains not much interesting stuff.'
2014-08-22 14:00:22 775
原创 An example in sklearn: Faces recognition example using eigenfaces and SVMs
Some basic concept:F1 score:
2014-08-18 10:11:48 996
转载 决策树剪枝的方法与必要性
zhuan1 决策树剪枝的必要性本文讨论的决策树主要是基于ID3算法实现的离散决策树生成。ID3算法的基本思想是贪心算法,采用自上而下的分而治之的方法构造决策树。首先检测训练数据集的所有特征,选择信息增益最大的特征A建立决策树根节点,由该特征的不同取值建立分枝,对各分枝的实例子集递归,用该方法建立树的节点和分枝,直到某一子集中的数据都属于同一类别,或者没有特征可以在用于对数据进行分割。ID
2014-08-16 16:53:23 7147
转载 转贴一篇关于NLTK的中文文章
加载中…小森的拇指书屋http://blog.sina.com.cn/lovelyls[订阅][手机订阅] 这是一篇介绍NLTK的文章,原载于这里,值得一看,唯一不足之处在于作者对于一些名词的解释略显业余,同时对于最新版的NLTK,我们在代码上的实现和原文上还是有些出入的。
2014-08-12 17:10:30 1101
转载 feature_extraction
Cloga的互联网笔记ArchiveCategoriesPagesTags关于Clogasklearn文本特征提取 19 January 2014 文本特征提取词袋(Bag of Words)表征文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长
2014-08-11 09:41:26 1443
转载 python + request + lxml的几个例证
From: http://www.educity.cn/wenda/81465.html
2014-08-07 14:34:36 1208
转载 python requests的安装与简单运用
From: http://www.zhidaow.com/post/python-requests-install-and-brief-introduction
2014-08-07 14:32:53 581
转载 HTTP Request header
From http://www.cnblogs.com/lexus/archive/2012/02/21/2360944.html
2014-08-07 14:27:36 508
转载 Python scikit-learn机器学习工具包学习笔记:feature_selection模块
sklearn.feature_selection模块的作用是featureselection,而不是feature extraction。Univariate featureselection:单变量的特征选择单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标重要。剔除那些不重要的指标。sklearn.feature_selectio
2014-08-07 10:14:40 2652
转载 Python scikit-learn机器学习工具包学习笔记:cross_validation模块
From:http://blog.sina.com.cn/s/blog_6a90ae320101a5rc.htmlsklearn.cross_validation模块的作用顾名思义就是做crossvalidation的。crossvalidation大概的意思是:对于原始数据我们要将其一部分分为train data,一部分分为testdata。train data用
2014-08-07 09:48:40 7740
转载 python中xrange和range的异同
range 函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。range示例: >>> range(5) [0, 1, 2, 3, 4] >>> range(1,5) [1, 2, 3, 4] >>> range(0,6,2)[0, 2, 4]xrange 函数说明
2014-08-06 11:17:35 415
转载 PyMongo基本使用
引用PyMongo>>> import pymongo 创建连接Connection>>> import pymongo>>> conn = pymongo.Connection('localhost',27017)或>>> from pymongo import Connection>>> conn = Connec
2014-08-04 15:03:16 478
原创 The difference between read, readline, readlines in Python
A simple test could clearly illustrate the difference.#
2014-07-22 10:01:58 570
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人