自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (2)
  • 收藏
  • 关注

原创 安装Semantic UI中遇到的问题

1.不知道是网络问题还是源的问题,根据官网http://www.semantic-ui.cn/introduction/getting-started.html中的命令,导致Ubuntu软件仓库源在更新时总是报错.然后百度各种解决办法不但没有解决,还把原来默认的软件源都改了…事实证明,不要手jian…在此提供Ubuntu16.04正版源: terminal中打开sudo gedit /etc...

2018-06-21 15:36:18 934

原创 python报错: Resource u'tokenizers/punkt/english.pickle' not found.

错误详解 Resource u’tokenizers/punkt/english.pickle’ not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download()解决方法:terminal输入一下代码: python ...

2018-05-22 10:05:27 965

原创 数据清洗工具OpenRefine

安装教程及简介:http://www.52ml.net/235.html

2017-11-16 09:31:34 561

转载 tflearn安装报错hdf5 is not supported on this machine

在ubuntu16.04系统中,安装好tensorflow和tflearn后,运行python tflearn命令时报以下错误: hdf5 is not supported on this machine scipy not supported!解决方法很简单,两行代码就可以解决,如下: pip install h5py --user sudo apt-

2017-10-24 21:00:55 1873

原创 Ubuntu16.04+python2.7+Selenium3.4.3学习笔记

目标:爬去知网论文全文主要内容报错解决 https://askubuntu.com/questions/870530/how-to-install-geckodriver-in-ubuntu原因 没有geckodriver驱动器无法执行webdriver.Firefox()

2017-07-12 13:14:22 269

原创 MySQL数据导入报错解决

报错如下:2006 - MySQL server has gone away 问题:连接服务器超时,影响原因很多,比如数据包过大等。。1153 - Got a packet bigger than 'max_allowed_packet' bytes 问题:MySQL默认读取执行的SQL文件最大为16M,当导入文件过大会是超出部分导入失败解决:找到my.ini文件(Windows下)定位到相应参

2017-05-27 09:18:20 1149

原创 mysql-5.7.18解压版下载,安装及启动mysql服务(图文)

因MySQL Community Server5.7.18的分发包中没有.ini文件,且不会初始化数据目录,故网上之前的版本安装改配置教程不适用 本文方法有效可靠,居家必备~

2017-05-05 09:57:31 466

转载 matplotlib绘图进行数据分析

http://www.2cto.com/kf/201407/317115.html

2017-04-12 17:18:41 302

转载 Spark MLlib 文本特征提取(TF-IDF/Word2Vec/CountVectorizer)

Spark MLlib 提供三种文本特征提取方法,分别为TF-IDF、Word2Vec以及CountVectorizer,其原理与调用代码整理如下:TF-IDF 算法介绍:词频-逆向文件频率(TF-IDF)是一种在文本挖掘中广泛使用的特征向量化方法,它可以体现一个文档中词语在语料库中的重要程度。词语由t表示,文档由d表示,语料库由D表示。词频TF(t,,d)是词语t在文档d中出现的次数。文件频率D

2017-03-29 09:52:40 1240

转载 统计量详解

SSE(和方差、误差平方和):The sum of squares due to error MSE(均方差、方差):Mean squared error RMSE(均方根、标准差):Root mean squared error R-square(确定系数):Coefficient of determinationSSE(和方差)该统计参数计算的是拟合数据和原始数据对应点的误差的平方和。

2017-03-29 09:02:34 813

转载 WindowsError的错误代码详解

0操作成功完成。 1功能错误。 2系统找不到指定的文件。 3系统找不到指定的路径。 4系统无法打开文件。 5拒绝访问。 6句柄无效。 7存储控制块被损坏。 8存储空间不足,无法处理此命令。 9存储控制块地址无效。 10环境错误。 11试图加载格式错误的程序。 12访问码无效。 13数据无效。 14存储器不足,无法完成此操作。 15系统找不

2017-03-23 17:50:45 311

转载 Non-ASCII character 'xe5' in file”报错问题

Non-ASCII character ‘xe5’ in file”报错问题源代码第一行添加# -- coding: UTF-8 --

2017-03-23 17:44:45 1395

Selenium完整教程

详细讲解了Selenium工具的使用过程,并有源码和讲解,可直接copy

2017-10-08

文档聚类源码包含原数据

文档聚类完整项目,虽然是ipynb但是可以转到python,还有实现结果图

2017-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除