自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (1)
  • 收藏
  • 关注

转载 正则表达式的特殊字符

正则表达式的特殊字符 符号 说明 ^ 正则表达式的开始字符 $ 正则表达式的结束字符 \w 匹配字母、数字、下划线 \W 匹配不是字符、数字、下划线的字符 \s 匹配空白字符 \S 匹配不是空白的字符 \d 匹配数字 \D 匹配非数字的字符

2017-11-03 17:44:24 2232

转载 encode和decode

字符串在Python内部的表示是unicode编码. 在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再unicode编码(encode)成另一种编码。    decode的作用是将其他编码的字符串转换成unicode编码,    如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicod

2017-11-03 17:25:18 374

转载 [python] 转义符、格式化字符串的替代符

http://xukaizijian.blog.163.com/blog/static/170433119201111114255393/

2017-11-03 17:03:13 1145

转载 re模块中match对象的方法和属性

属性和方法 说     明 Pos 搜索的开始位置 Endpos 搜索的结束位置 String 搜索的字符串 Re 当前使用的正则表达式的对象 Lastindex 最后匹配的组索引 Lastgroup 最后匹配的组名 group(index=0) 某个分组的匹配结果。如果index等

2017-11-03 11:41:14 2388

转载 cookielib模块基础学习

# -*- coding: utf-8 -*-# python:2.x__author__ = 'Administrator'import cookielib#主要用于处理http客户端的cookie #cookielib.loadError在一个异常文件中失败加载,是IOEerror的子类#cookielib.CookieJar用于存储cookie对象,此模块

2017-11-01 16:40:59 417

转载 cookielib的使用

为什么要获取cookie直接写这段代码就可以:#获取一个保存cookie的对象 cj = cookielib.LWPCookieJar()#将一个保存cookie对象,和一个HTTP的cookie的处理器绑定 cookie_support = urllib2.HTTPCookieProcessor(cj) #创建一个opener,将保存了cookie的http处理器,还

2017-11-01 16:33:51 1433

转载 cookielib 模块基本运用

cookielib 模块提供了可储存 cookie 的对象。捕获cookie后并在后续连接请求的重新发送。处理包含 cookie 的文件1. CookieJar:储存在内存中import urllib2import cookirlibcookie = cookielib.CookieJar()handler = urllib2.HTTPCookieProcessor(cooki

2017-11-01 16:26:11 980

转载 零基础写python爬虫之urllib2中的两个重要概念:Openers和Handlers

在开始后面的内容之前,先来解释一下urllib2中的两个个方法:info / geturl urlopen返回的应答对象response(或者HTTPError实例)有两个很有用的方法info()和geturl()1.geturl():这个返回获取的真实的URL,这个很有用,因为urlopen(或者opener对象使用的)或许会有重定向。获取的URL或许跟请求URL不同

2017-11-01 14:36:29 344

转载 Python中Http的GET或POST请求支持Gzip压缩

【问题】 在用python抓取网页的时候,很多网页返回的html的数据量比较大,比如好几十KB, 希望在提交http的请求的时候,支持Gzip压缩,已减少数据量传输。【解决过程】 1.参考 http://flyash.itcao.com/post_1117.html 中说的, 只需要在header中添加accept-encoding就可以了。 去试试。 2.

2017-10-30 11:03:19 3497

转载 设置Accept-Encoding为gzip,deflate,返回的网页是乱码

用C#写代码去获取网页内容。其中request的header中,设置Accept-Encoding为gzip,deflate:req = (HttpWebRequest)WebRequest.Create(gSkydriveUrl);req.Headers.Add("Accept-Encoding", "gzip,deflate");结果始终返回是乱码:

2017-10-30 10:59:35 43707 6

转载 【经验总结】Http,网页访问,HttpRequest,HttpResponse相关的知识

以下记录自己在用C#语言,实现网页内容抓取,模拟登陆网页等过程中,所从无到有,一点点知道的一些知识,记录下来,以供参考(高手不要笑哈): 1.Host不是自己指定/设置的,而是http请求会自动去设置用C#写http请求的header中,开始以为Host也是自己设置的:req.Headers.Add(“Host”, “login.live.com”);结果发

2017-10-30 10:43:45 525

转载 Python 2.x中常见字符编码和解码方面的错误及其解决办法

Python 2.x中的字符编码,设计的的确不好,导致初学者,甚至是即使用Python很长时间的人,都会经常遇到字符编解码方面的错误。下面就把一些常见情,尽量的都整理出来,并给出相应的解决办法。看此文之前Python中字符编码所涉及的背后逻辑(从你输入字符,到终端显示字符的背后过程)在去了解Python编码解码之前,还有个更加重要,但是很多时候却被其他解释相关知

2017-10-27 16:35:18 300

转载 Python 2.x中的和编码相关的常见问题和注意事项

声明:1.本文不再更新。2.本人内容,已合并到:【总结】Python中常见字符编码和解码方面的错误及其解决办法新帖子总结的更加全面,并且分析了原因,和总结了解决办法,还给出了示例代码。3.这方面的内容,如有更新,也只会更新到上述新帖子中。Python 2.x中,的确是,经常性地,容易出现字符编码相关的错误。即便像我这样的,算是在字符编码折

2017-10-27 16:18:01 208

转载 【整理】Python的字符编码检测库:charade和chardet的区别

【背景】之前用过Python的chardet:https://pypi.python.org/pypi/chardet(代码下载在:https://github.com/dcramer/chardet)现在,在看Requests的编码方式时,看到有个新的字符编码检测库:charadehttps://pypi.python.org/pypi/chara

2017-10-27 16:15:24 478

转载 【教程】如何用Python中的chardet去检测字符编码类型

【背景】之前已经使用过chardet了,也算用了不少次了。之前也写过和chardet相关的:【已解决】windows下,安装python的chardet【问题】Python中用Chardet检测出来从Windows的cmd中输入的字符串的编码是KOI8-R,而不是所希望的GBK或GB2312【整理】Python的字符编码检测库:charade和chardet

2017-10-27 16:13:19 819

转载 str字符和unicode字符的区别

实际情况是,beautifulsoup处理后的网页,的确是utf-8的。而utf-8和unicode,本身就不相等。首先,字符串分两种,一种是str字符,一种是unicode字符。str字符,就是普通字符,某种编码的字符,包括ANSI,GBK,UTF-8等,而Unicode就是原始的unicode,未经过encode编码的unicode,而进过某种编码,比如utf-8,gbk等编码后的unic

2017-10-27 14:12:56 4006

转载 Win7中的Cmd命令行的使用技巧

对于Windows系统中的cmd工具,很多人都知道和使用过。我之前也用过,但是后来看到了这个:Windows7 CMD提示的5个技巧,才发现,原来还有更多的一些小技巧,是之前不知道的。所以现在来总结一下:【win7中cmd的一些高级的使用技巧】先说说我之前不知道的一些功能:1.cmd中按F7,可以调出(之前所输入的)命令的历史列表上图:用法是

2017-10-26 17:52:37 10041

转载 Python 抓取网页学习系列之一(网页编码格式

第一步:你需要知道你所抓取的网页编码格式,方法:右键查看网页编码,ctrl +F ,搜索:charset会看到:gbk" />,OK确定是gbk编码格式了;为什么会提到编码,这里大概讲讲原理:    我们看到的所有字符,在计算机里面都是用01010101二进制编码,然后你要想在屏幕上看到ABCD,计算机需要指定某个特定的二进制串来对应ABCD,比如A是011,0100是B等,每个字母都

2017-10-20 16:15:46 943

转载 自学Python八 爬虫大坑之网页乱码

Bug有时候破坏的你的兴致,阻挠了保持到现在的渴望。可是,自己又非常明白,它是一种激励,是注定要被你踩在脚下的垫脚石!  python2.7中最头疼的可能莫过于编码问题了,尤其还是在window环境下,有时候总是出现莫名其妙的问题,有时候明明昨天还好好的,今天却突然。。。遇到这种问题真的是一肚子的火。。。fuck!  首先,在我们编写python代码的时候就要注意一些编码的规范。

2017-10-20 16:10:34 285

转载 github使用入门 之GIT GUI Windows版

申明下是原创。这二天网上也看了不少关于github使用的文章,github对代码管理也开始用起来了。这篇给github新手看,大牛们请跳过。github说白了就是版本管理库,最常用的就是程序代码管理了。不过我也在github上看到有人在用它作为书本编辑,确实很强大。 本篇内容包括github基础安装github提交一个版本github删除版本库 

2017-10-17 11:11:03 398

转载 window下配置SSH连接GitHub、GitHub配置ssh key

遇到了github上无法增加ssh的问题,在setting中重新载入ssh and GPG keys页面。然后在git bash中当前路劲进入到c盘下的ssh页面,重新生成ssh keys。按一下步骤修改,最后成功!第一部分介绍:在windows下通过msysGit(Git for windows、Git Bash)配置SSH Keys连接GitHub。第二部分介绍

2017-10-17 10:56:52 396

转载 shell脚本命令 运行python文件&python命令行运行python代码

单独的python文件运行的时候 报错:在shell脚本中,运行shell脚本命令;在Python命令行中,运行Python代码。然而,“python hello.py”是一个脚本命令,不是python代码。      因此,退出python命令行,直接cd到hello.py所在目录,运行python hello.py,即可。       若是非要在python命令

2017-10-13 11:38:48 3788

转载 windows环境下pip安装python的包时候提示invalid syntax

刚学python,用pip安装出错,如下图:检查了一下环境变量,然而并没没问题。在stackowerflow上逛了一圈,找到了解决方法:在命令行下cd 进对应python的script文件目录,再执行pip指令即可。

2017-10-11 14:21:18 17766 3

转载 Python的hasattr() getattr() setattr() 函数使用方法详解

Python的hasattr() getattr() setattr() 函数使用方法详解hasattr(object, name)判断一个对象里面是否有name属性或者name方法,返回BOOL值,有name特性返回True, 否则返回False。需要注意的是name要用括号括起来 1 >>> class test(): 2 ... name="

2017-10-11 09:30:27 359

转载 Python补充05 字符串格式化 (%操作符)

Python补充05 字符串格式化 (%操作符)作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 在许多编程语言中都包含有格式化字符串的功能,比如C和Fortran语言中的格式化输入输出。Python中内置有对字符串进行格式化的操作%。 模板格式化字符串时,Python使用一个字符串作为

2017-10-07 16:16:20 226

转载 使用raise语句自己触发异常

我们可以使用raise语句自己触发异常raise语法格式如下:raise [Exception [, args [, traceback]]]语句中Exception是异常的类型(例如,NameError)参数是一个异常参数值。该参数是可选的,如果不提供,异常的参数是"None"。最后一个参数是可选的(在实践中很少使用),如果存在,是跟踪异常对象。实例一

2017-09-28 16:24:25 2220

转载 异常处理try...except、raise

一、try...except有时候我们写程序的时候,会出现一些错误或异常,导致程序终止。例如,做除法时,除数为0,会引起一个ZeroDivisionError例子:1234a=10b=0c=a/bprint "done"运行结果:T

2017-09-28 15:29:10 400

转载 python字符串/元组/列表/字典互转

#-*-coding:utf-8-*- #1、字典dict = {'name': 'Zara', 'age': 7, 'class': 'First'}#字典转为字符串,返回: {'age': 7, 'name': 'Zara', 'class': 'First'}print type(str(dict)), str(dict)#字典可以转为元组,返回:('age', 'name', 'class

2017-09-22 17:48:28 198

转载 python抓取网页中图片并保存到本地

#-*-coding:utf-8-*- import osimport uuidimport urllib2import cookielib'''获取文件后缀名'''def get_file_extension(file):      return os.path.splitext(file)[1]  '''創建文件目录,并返回该目录'''

2017-09-22 17:43:39 1211

转载 dict,set,list,tuple应用详解

本文深入剖析了python中dict,set,list,tuple应用及对应示例,有助于读者对其概念及原理的掌握。具体如下:1.字典(dict)dict 用 {} 包围 dict.keys(),dict.values(),dict.items() hash(obj)返回obj的哈希值,如果返回表示可以作为dict的key del 或 dict.pop可以删除一个item,clear清除

2017-09-22 17:08:17 220

转载 list,tuple,dict,set的区别和用法

Python语言简洁明了,可以用较少的代码实现同样的功能。这其中Python的四个内置数据类型功不可没,他们即是list, tuple, dict, set。这里对他们进行一个简明的总结。List字面意思就是一个集合,在Python中List中的元素用中括号[]来表示,可以这样定义一个List:?1L=[1

2017-09-22 16:59:36 3949

转载 用Python版微信SDK wechat-sdk去给微信公众号创建菜单

https://www.crifan.com/use_python_wexin_sdk_wechat_sdk_to_create_public_numer_menu/之前已经:[已解决]Flask中如何获取微信POST发送过来的body的数据了,然后现在去尝试创建菜单自定义菜单创建接口 – 微信公众平台开发者文档

2017-09-15 15:39:01 2327

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除