自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

转载 正则表达式中文和中文符号

匹配中文标点符号: [\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]匹配中文字符的正则表达式: [\u4e00-\u9fa5]\uff0c:中文逗号https://blog.csdn.net/weixin_44521703/article/details/100187377...

2020-03-20 15:12:55 3611

原创 xpath语法

xpath学习重点1 获取文本 -'a/text()' 获取a下的文本 -'a//text()' 获取a下的所有标签文本 -'//a[text()='下一页']' 选择文本为下一页三个字的a标签2 @符号 -'a/@href' 获取属性 -'//ul[@id="detail-list"]' 元素定位3 '//' -在xpath开始的时候表示从当前ht...

2020-03-13 09:08:48 133

原创 爬虫-requests请求网页总结

相关基本常识解释User_Agent:浏览器名称,修改版本以及版本号可爬取手机页面cookie:保存浏览器本地用户信息(容量有限)session:保存在对方服务器上,比cookie安全referer:当前页面跳转之前的页面Upgrade-Insecure-Requests:将http升级为https请求协议X-requested-wth:XMLHTTPRequests,是A...

2020-03-12 16:35:21 378

原创 正则表达式

Python中的re模块匹配某个字符串import retext='hello'ret=re.match('he',text)print(ret.group())import retext='hello'ret=re.match('.',text)//'.' 匹配任意一个字符print(ret.group())-->hmatch()函数从第一个元素...

2020-03-12 16:16:02 107

原创 爬虫数据存储方式

Json文件JSON支持数据格式:1 对象(字典),使用{}2 数组(列表),使用[]3 整形、浮点型、布尔类型还有null类型4 字符串类型(字符串必须用双引号(""),不能用单引号(''))import jsonperson=[{'user':'zhangsan','id':01},{'user':'lisi','id'=02}]json_str=json.d...

2020-03-12 16:09:27 243

原创 爬虫-lxml和BeautifulSoup解析网页总结

爬虫的几种解析数据的方法Python中的lxml模块使用示例:from lxml import etreehtmlelement = etree.HTML(html.text)print(etree.tostring(htmlelement,encoding='utf-8').decode('utf-8'))使用etree.parse()解析函数默认是使用xml解析器,遇到不...

2020-03-12 12:07:29 984

转载 关于CSS选择器

关于CSS选择器部分摘自另一博友博文:原文链接:https://blog.csdn.net/olizxq/article/details/81838212。关于CSS选择器:CSS基本语法 1元素选择器: 直接选择文档元素 比如head,p 2 类选择器: 元素的class属性,比如<h1 class="import...

2020-03-12 12:03:25 112

原创 python利用ibm_db连接DB2数据库报错,且看不到任何报错信息。

pycharm安装ibm_db的方法:1 通过pycharm下的settings下的project interpreter,选对解释器后,点击加号,搜索ibm_db即可安装;(python3.7.3可能找不到此包)2 在有网的情况下,在pycharm的ternimal下pip install ibm_db安装即可;3 通过cmd安装。首先下载ibm_db安装包,https://pypi...

2019-11-07 08:50:27 1285

原创 关于DBvisualizer pro中建表,报错-104

今晚建表时,一直不成功。原因是因为我添加了备注信息,所以一直报-104语法错误。而且sql语句中的备注信息乱码,所以预测是编辑器的编码方式存在问题!!...

2019-10-31 21:04:59 581

原创 关于Python中的类与属性

根据廖雪峰老师的网站,学习过后的笔记问题:请把下面的Student对象的gender字段对外隐藏起来,用get_gender()和set_gender()代替,并检查参数有效性:...

2019-09-29 18:54:05 154

notebook.pdf

在conda或者python下,通过一种方法轻松的将已有库离线安装到另外一台电脑上的方法。先在有线的环境下下载所需要的python库,然后按照文件中的方法进行离线安装。

2019-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除