自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2...错误

在用scrapy爬取网页数据时,Selector解析网页数据时会出现如题的错误。site.xpath('//table[2]/tr[3]/td[2]/text()').extract()[0]这样写site.xpath('//table[2]/tr[3]/td[2]/text()')打印,是不会报错的。加上extract()就会报这样子的错。因为extract()返回选中内容的Unicode字符串...

2018-05-18 16:45:29 1494

原创 selenium+webdriver+chromedriver爬取百度图片(二)

可以滚动轴往下滑动获取更多图片的代码def scrollBy(index, driver): i = 0 while i <= index: time.sleep(3) driver.execute_script("window.scrollBy(0," + str(1000 * i) + ")") i += 1然后在上一篇中调...

2018-05-18 16:25:35 1205 1

原创 selenium+webdriver+chromedriver爬取百度图片(一)

环境准备:安装selenium,chromedriver,BeautifulSoup建议先安装pip,然后可以直接pip来安装很多相关的插件直接上代码import timeimport requestsfrom selenium import webdriverfrom bs4 import BeautifulSoupuser_agent = "Mozilla/5.0 (Windows...

2018-05-18 16:21:52 2933

原创 安装pyhton3.4和配置环境变量

介绍:Python的3.0版本,常被称为Python 3000,或简称Py3k。相对于Python的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下兼容。下载地址:我的资源_python3.4.4此版本是windows64位的。双击安装。配置环境变量:进入环境变量在选中path编辑在path后面追加python安装的目录地址我安装在C:\Python...

2018-05-18 15:36:30 2882 1

python3.4.4 64位

用于python3.4的版本安装包。Python的3.0版本,常被称为Python 3000,或简称Py3k。相对于Python的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下兼容。

2018-05-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除