自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 问答 (1)
  • 收藏
  • 关注

原创 python连接ORACLE数据库

环境:1、需要oracle客户端2、cx_Oracle模块Python一个官方网站PyPI,上面有丰富的模块。cx_Oracle就可以在PyPI中下载。打开PyPI的网址https://pypi.python.org/pypi,在里面搜索cx_Oracle,即可找到该模块根据自己安装的python版本找到要下载哪个下载后放到合适的目录下。这个是.whl文件,安装.whl文...

2019-09-20 10:07:48 420

原创 requests+beautifulsoup爬虫

爬虫简单入门。由于工作需要,需要从网上爬取一些内容。在此记录一下开发过程遇到的问题爬取航空公司信息。包括航空公司中英文名、二字码、三字码、呼号等信息。调研从https://www.ufsoo.com/airline/page-12.html网站获取信息。信息格式为:需要的内容包含<p>标签中。所以选择用beautifulsoup 的find_all获取所有p标签下的...

2019-09-19 15:55:22 160

转载 spoon各个控件的说明

文章转载自:http://blog.csdn.net/sinat_19171485/article/details/47123501文本文件输入(text input):读取大量不同的文本文件。大多是通过工具生成的CSV文件。表输入(table Input):常用来利用连接和SQL,从数据中读取信息,自动生成基本的SQL语句。获取系统信息(g

2017-12-11 17:05:41 2664

原创 Python-二分法查找

二分法算法原理:数组是有序数组,确定该期间的中间位置center将查找的值key与array[center]比较。若相等,查找成功返回此位置;否则确定新的查找区域,继续二分查找。新区域的确定:如果key>arrey[center],则起始位置变为center+1,结束位置不变如果key每一次查找与中间值比较,可以确定是否查找成功,不成功当前查找区间缩小一半。递归找,即可。

2017-08-27 19:01:28 2570

转载 Python进行词频统计

统计词频

2017-08-27 18:53:16 842

原创 Python基础(八)---进程间通信-Queue

进程之间需要通信,操作系统提供了很多机制来实现进程间的通信1.multiprocessing模块的QUEUE实现多进程之间的数据传递。Queue本身是一个消息队列程序。初始化一个Queue对象 q=Queue(num),num 表示最多接收的消息数量,如果不指定,或数量为负数,那么久代表可接收的消息数量没有上限,直到内存的尽头;Queue.qsize():返回当前队列包含的消息

2017-08-06 16:52:48 839

原创 Python基础(八)-系统编程之进程--multiprocessing(阻塞非阻塞)

进程拥有自己独立的堆和栈,既不共享堆,亦不共享栈,进程由操作系统调度。线程拥有自己独立的栈和共享的堆,共享堆,不共享栈,线程亦由操作系统调度(标准线程是的)。协程和线程一样共享堆,不共享栈,协程由程序员在协程的代码里显示调度 multiprocessing模块提供了process类来代表一个进程对象。 语法结构: process([group[,target[,na

2017-08-06 09:26:03 5738

原创 Python基础(七)系统编程之进程-fork

1.进程的创建:fork():Python的os模块封装了常见的系统调用。,调用fork( )函数就可以创建子进程普通函数调用一次,返回一次,fork()调用一次,返回两次。操作系统自动把父进程复制一份,分别在父进程和子进程内返回。注意:fork()函数只在unix/linux/Mac上运行,Windows上不可以运行。import ospid = os.fork()    

2017-08-06 09:03:51 237

原创 python基础(五)--文件的相关操作

文件的打开和关闭:1.打开文件f.open('text.txt','w')   w,打开一个文件只用于写入,文件存在则覆盖,不存在,创建新文件,wb以二进制格式打开一个文件只用于写入。存在,覆盖,不存在,创建。2.关闭文件:close() 文件的 读写:1.写数据: write()f.open('test.txt','w')f.write('hello python

2017-08-04 10:00:10 448

原创 Python基础(四)-列表的相关操作

列表是可变类型,列表中存放的数据是可以进行修改的,增删改1.添加元素(append,extend,insert)1)append可以向列表中添加元素2)extend可以将另一个集合中的元素逐一添加到列表中。3)insert 在指定位置index前插入元素2.修改元素、:通过下标来确定。3.查找元素:in,not in,index,count就是看看指定的元素是否存在

2017-08-03 22:01:23 316

原创 python基础(三)字符串的常见操作

字符串中下标的使用:1、切片:语法[起始:结束:步长 ]选取区间为左闭右开类型,步长为负数,表示逆序。反转字符串:2.find。检测str是否包含在mystr中,是则返回索引值,否则返回-1.3.index 与find方法一样,如果str不在mystr中会报一个异常。4.count  返回str在start和end之间在mystr里面出现的次数

2017-08-03 21:36:47 311

原创 cookie在爬虫方面的应用-模拟登录

Cookies在爬虫方面最典型的应用是判定注册用户是否已经登录网站,在下一次进入此网站时保留用户信息,可以简化登录或其他验证过程。在模拟登录网站时:需要发送一个post请求去获取有登录信息的cookie(登录页面跳转到用户页面的时候,抓包此时的cookie是一个保存了用户登录状态的cookie)需要把cookie信息放入headers中。这种方法需要浏览器登录用户名和密码。比较复杂,下面介绍一

2017-08-01 20:51:18 848

原创 Python爬虫---处理HTTPS请求 SSL证书验证

处理HTTPS请求 SSL证书验证

2017-08-01 20:07:33 13855 1

原创 Python--get和post请求

Python语言--get和post请求

2017-08-01 20:02:04 1022

原创 用户变量和环境变量路径

Ubuntu 用户变量、环境变量位置   ~/.bashrc系统变量位置:/etc/profile打开.bashrc配置环境变量可在/etc/profile或自己的~/.bashrc中利用alias设置指令的别名。修改完变量之后,要source /etc/bashrc  或者source ~/.bashrc使其生效。MAC ~/.bash_p

2017-07-18 11:39:45 1693

原创 Python爬虫(二、urllib2的urlopen方法和Request请求对象)

1、urlopen:不能伪装成一个浏览器。url:(统一资源定位符)要访问的url地址data:表示要往网页中传输的内容,即post请求。timeout 设置过期时间,默认是180s.如果网页import urllib2def urlopen():response = urllib2.urlopen('http://www.baidu.com')html

2017-07-16 16:34:56 8789

原创 HTTP请求

浏览器发送HTTP请求的过程:HTTP请求主要分为Get和Post两类:

2017-07-16 15:24:19 222

原创 网络爬虫基础

网络爬虫网页的三大特征爬虫的设计思路Python做爬虫的优势爬虫知识储备

2017-07-16 08:55:21 321

原创 Python基础(一、变量和 常用内置函数)

有时间整理一下Python基础的东西。变量和内置函数Python中修改变量的值的操作,并不是直接修改变量的值,而是修改了变量指向的内存地址(即引用)定义变量名:变量名必须以字母和下划线开头,变量名对字母的大小写敏感不能使用关键字作为变量名。导入keyword模块后,使用print(keyword。kwlist)查看Python的所有关键字。不建议使用系统内置的模块名、类型名、函

2017-07-15 17:04:03 319

转载 session和cookie

session简单来说就是服务器给客户端的一个编号。像一个临时的容器来存放这些临时的东西。当一台WWW服务器运行时,可能有若干个用户浏览正在运正在这台服务器上的网站。当每个用户首次与这台WWW服务器建立连接时,他就与这个服务器建立了一个Session,同时服务器会自动为其分配一个SessionID,用以标识这个用户的唯一身份。这个SessionID是由WWW服务器随机产生的一个由24个字符组成

2017-07-14 11:48:48 151

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除