自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

转载 PCA降维的数学推导

http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇...

2018-03-09 17:19:32 1211

转载 基于scikit-learn包实现机器学习之KNN(K近邻)

sklearn内置数据集数据是机器学习的关键,在机器学习工作中我们需要花费大量的时间来采集和整理数据,合理且科学的数据是得到良好机器学习效果的关键。一般而言,一个分类问题的机器学习过程需要用到四块数据内容,分别是:训练数据,一般用train来表示训练数据的分类属性,一般用target来表示测试数据,一般用test来表示测试数据的真实分类属性,用于评估分类器性能,一般用expecte

2018-01-22 01:04:00 414

转载 linux上通过virtualenv部署虚拟环境

virtualenv可以搭建虚拟且独立的python环境,可以使每个项目环境与其他项目独立开来,保持环境的干净,解决包冲突问题。一、安装virtualenv    virtualenv实际上是一个python包,所以我们可以用easy_install或者pip安装。下面介绍在CentOS系统上的安装方法。    easy_install安装方式:

2017-12-19 21:59:03 2190

原创 uuid简单用法

uuid可用于给各文件命名 import uuid a = uuid.uuid4() print(a)输出UUID(‘240603a6-daf5-4153-9bdb-eaaf42ef32ac’)

2017-11-07 17:47:03 1861

转载 Fiddler使用,http原理

Fiddler的基本介绍  Fiddler的官方网站:  www.fiddler2.com      Fiddler的官方帮助:http://docs.telerik.com/fiddler/knowledgebase/quickexec  Fiddler官方网站提供了大量的帮助文档和视频教程, 这是学习Fiddler的最好资料。  Fiddler是最强大最好用的Web调试工具

2017-11-07 13:29:51 828

转载 selenium.webdriver中添加代理

Firefox中设置代理ip   method_1 from selenium import webdriver profile = webdriver.FirefoxProfile() profile.set_preference(‘network.proxy.type’, 1) profile.set_preference(‘network.proxy.http’, ‘127.0.0.

2017-10-26 00:14:38 3052 1

原创 ChainMap用法

from collections import ChainMap这是ChainMap的parents和new_child()用法values = ChainMap() values[‘x’] = 3 values = values.new_child() values[‘x’] = 2 print(values) values = values.new_child() print(val

2017-10-21 11:20:36 1000

转载 _slots_用法

class Student(object): slots = (‘name’, ‘age’) # 用tuple定义允许绑定的属性名称class GraduateStudent(Student): passs = Student() # 创建新的实例 s.name = ‘Michael’ # 绑定属性’name’ s.age = 25 # 绑定属性’age’ERROR: Att

2017-10-21 10:55:36 326

转载 可变长参数列表*args,**kwargs

或者可以叫做,在Python中如何使用可变长参数列表函数定义 这是一种特殊的语法,在函数定义中使用*args和kwargs传递可变长参数. *args用作传递非命名键值可变长参数列表(位置参数); kwargs用作传递键值可变长参数列表下面的例子传递一个位置参数以及两个可变长参数def test_var_args(farg, *args): print “formal arg:”, fa

2017-10-21 10:47:23 348

转载 scrapy传递item

def parse(self, response): # collect `item_urls` for item_url in item_urls: yield Request(url=item_url, callback=self.parse_item) def parse_item(self, response):

2017-10-20 00:42:47 937

原创 webdriver保存验证码截图

element = wait.until ( EC.visibility_of_element_located((By.CSS_SELECTOR,'.quc-main .quc-field-captcha img')))  #获取验证码browser.save_screenshot('screenshot.png')left = element.location['x']

2017-10-18 23:32:39 1173

转载 webdriver.chrome()禁止加载图片

from selenium import wendriverchrome_options = webdriver.ChromeOptions()prefs = {"profile.managed_default_content_settings.images": 2}chrome_options.add_experimental_option("prefs", prefs)browser

2017-10-18 21:31:58 13013

原创 python中过滤器filter用法

#第一个参数是一个返回bool值的一般函数或lambda函数,第二个参数是一个可迭代对象#最后返回一个可迭代对象,可以通过list获得def is_positive(item): return item>0values = [1,-2,3,-4]print(filter(is_poditive,values))a = list(filter(is_positive,values)

2017-10-10 21:40:31 11013 1

原创 Beautiful学习笔记

```pythonfrom bs4 import BeautifulSoup```# # 标签选择总结:获取tag时,总是获取第一个,若返回结果只有一个,则直接返回元素,若结果有多个,以迭代器返回,通过enumerate返回,两个标签之间若有换行,则有一个"\n "标签# 标签选择器### 选择元素(只返回第一个匹配标签)```pythonhtml = """

2017-10-08 16:52:54 274

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除