- 博客(4)
- 资源 (6)
- 收藏
- 关注
原创 Python Pandas读取中文格式CSV文件遇到的问题(UTF-8与UTF-8 BOM)
Python Pandas读取中文格式CSV文件遇到的问题在使用pandas进行文件读取的过程中遇到了一些匪夷所思的问题,经过摸索发现处在文件编码的格式上。 最开始的时候文件由xlsx文件转换成csv,excel默认格式为gb2312,在notepad++中转化成了UTF-8,但是在读取文件的时候总是出现第一列的列名“not in index”的错误,百思不得解。UTF-8和 UTF-8 BOM
2016-12-02 11:24:17 21630
原创 K-shingling
学习相似项发现的过程中出现了一个shingling小节,其中着重介绍了K-shingling,通过查找网络上的定义和例子,总结一下以便日后使用: 定义: 文档的K-shingling定义为其任意长度为K的字串,所以,每篇文档可以看成一次或多次的K-shiling集合。 例子: 比如,一个文档 “a rose is a rose is a rose”分词后的词汇(token,语汇单元)集合
2016-03-04 14:44:49 2520
原创 Anaconda 如何安装依赖包
需要使用python与MySQL数据库进行交互,所以需要import一个mysql-python的包,但是在inotebook中引用的时候发现Anaconda并没有包含该包,因此需要自己对该依赖包进行安装。 打开windows下的cmd,输入conda install mysql-python,回车,搞定! 其他的依赖包也可以使用该方法添加。
2015-11-22 10:46:27 4791
原创 关于Anaconda中ipython-notebook的py文件引用问题
关于Anaconda中ipython-notebook的py文件引用的问题
2015-11-15 21:03:25 4336
setuptools19.2
2016-12-09
javaSSH可运行框架附带数据库结构struts2+spring3+hibernate3
2016-05-05
net.sf.fjep.fatjar_0.0.32.jar for eclipse luna 4.4
2015-04-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人