自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 问答 (2)
  • 收藏
  • 关注

原创 LSH(局部敏感哈希算法)实现文本的相似性比对

源码见github:https://github.com/smallsmallcase/lsHash1.LSH算法简介:我们将这样的一族hash函数 H={h:S→U} 称为是(r1,r2,p1,p2)敏感的,如果对于任意H中的函数h,满足以下2个条件:如果d(O1,O2)如果d(O1,O2)>r2,那么Pr[h(O1)=h(O2)]≤p2其中,O1,O2∈S,表示两个具有多维

2017-10-19 19:47:41 2940 2

原创 机器学习算法笔记之K近邻算法(KNeighborsClassifier)

介绍:在sklearn库中,KNeighborsClassifier是实现K近邻算法的一个类,一般都使用欧式距离进行测量。这个类的结构如下:sklearn.neighbors.KNeighborsClassifierclass sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, weights=’uniform

2017-10-14 19:55:06 60508 8

原创 python中的可变数据类型和不可变数据类型的区别

最近在研究某一博主的代码时偶然发现了一个问题,第一反应肯定是我自己知识上的欠缺。然后经过各种百度啊之类的终于找到了原因。

2017-09-28 11:15:49 4213 2

原创 第一个基于scrapy框架的python程序

前一段时间做过一些爬虫的小项目,用的都是urllib基础库,后来听说用scrapy做爬虫效率高。经过一段时间的学习,做了一个基于scrapy框架的爬虫项目,爬取图片并且保存在本地。首先在item.py文件中定义我们要获取的内容:# -*- coding: utf-8 -*-# Define here the models for your scraped items## See doc

2017-08-24 18:06:52 880

原创 第一个爬虫小程序

在工程中最核心的就是获取消息列表,如下面所示:接下来

2017-08-11 18:06:10 2862

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除