自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

转载 2018年最常见的Python面试题&答案(上篇)

Q 1:Python有哪些特点和优点?作为一门编程入门语言,Python主要有以下特点和优点:可解释 具有动态特性 面向对象 简明简单 开源 具有强大的社区支持Q 2:深拷贝和浅拷贝之间的区别是什么?答:深拷贝就是将一个对象拷贝到另一个对象中,这意味着如果你对一个对象的拷贝做出改变时,不会影响原对象。在Python中,我们使用函数deepcopy()执行深拷贝,导入模块co...

2018-12-05 11:02:40 280

转载 Python爬虫实战之寻找你的招聘信息

 功能需求分析主要功能需求如下: 用户输入工作地点和感兴趣的职位信息; 根据指定输入信息进行多线程的网页爬取; 解析提取结构化的招聘信息; 将数据存入指定的数据库; 这里由于篇幅和时间原因,功能并没有那么复杂,但是博主会在后续加入更加丰富的功能,并与大家分享,包括: ip池的加入; 爬取和解析效率的优化; 对爬取数据进行数据...

2018-12-04 11:36:27 329

转载 最详细的Django框架入门

Django 是用Python开发的一个免费开源的Web框架,可以用于快速搭建高性能,优雅的网站!采用了MVC的框架模式,即模型M,视图V和控制器C,也可以称为MVT模式,模型M,视图V,模板T。在学习Django的过程中将学到的知识进行总结分享出来,温故而知新,如果能帮助到想学Django但不知道如何开始的同学是再好不过了。开始前的准备工作搭建虚拟环境随着我们项目的积累,有时候不同项...

2018-12-04 10:59:59 253

转载 Python数据分析入门实战项目

数据初探首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seaborn,以及机器学习包sklearn。二手房数据下载地址:链接:https://pan.baidu.com/s/1GGIbAf2ySdNOj9Hf9km-Pg 密码:f7amimport pandas as pdimport numpy as npimport seaborn as s...

2018-12-03 11:11:29 6795

转载 Python内建函数大全

Python 解释器内置了许多函数和类型,列表如下(按字母排序)abs(x)返回一个数字的绝对值。参数可以是整数或浮点数。如果参数是一个复数,则返回它的模。all(iterable)如果 iterable 的所有元素均为 True(或 iterable 为空),则返回 True。相当于:def all(iterable): for element in iterabl...

2018-12-03 11:09:14 252

转载 python装饰器和描述器的使用总结

装饰器毫无疑问在python中用得非常多def deco(func): def _deco(): print 'before invoked' func() print 'after invoked' return _deco@decodef f(): print 'f is invoked'在f上加dec...

2018-12-03 11:07:37 644

转载 爬虫入门到精通-headers的详细讲解(模拟登录知乎)

直接开始案例吧。本次我们实现如何模拟登陆知乎。1.抓包首先打开知乎登录页 知乎 - 与世界分享你的知识、经验和见解注意打开开发者工具后点击“preserve log”,密码记得故意输入错误,然后点击登录 我们很简单的就找到了 我们需要的请求   _xsrf:81aa4a69cd410c3454ce515187f2d4c9  ...

2018-11-30 11:20:23 592

转载 Python数据结构——二叉堆的实现

优先队列的二叉堆实现在前面的章节里我们学习了“先进先出”(FIFO)的数据结构:队列(Queue)。队列有一种变体叫做“优先队列”(Priority Queue)。优先队列的出队(Dequeue)操作和队列一样,都是从队首出队。但在优先队列的内部,元素的次序却是由“优先级”来决定:高优先级的元素排在队首,而低优先级的元素则排在后面。这样,优先队列的入队(Enqueue)操作就比较复杂,需要将元...

2018-11-30 11:18:44 193

转载 python--接口类与抽象类

一、继承有两种用途:""" 一:继承基类的方法,并且做出自己的改变或者扩展(代码重用) 二:声明某个子类兼容于某基类,定义一个接口类Interface,接口类中定义了一些接口名(就是函数名) 且并未实现接口的功能,子类继承接口类,并且实现接口中的功能 三、接口隔离原则:使用多个专门的接口,而不使用单一的总接口。即客户端不应该依赖那些不需要的接口""""""接口类:基于同...

2018-11-30 11:14:02 91

转载 Python利用结巴模块统计《水浒传》词频

中文分词是中文文本处理的一个基础性工作,结巴分词利用进行中文分词。其基本实现原理有三点:基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG) 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合 对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法 下面利用结巴分词队水浒传的词频进行了统计 ...

2018-11-29 10:37:33 1798

转载 结巴分词原理

介绍结巴分词是一个受大家喜爱的分词库,源码地址为github,今天我们就跟进源码,看一下结巴分词的原理原理,代码如下

2018-11-29 10:36:11 269

转载 python面向对象编程之组合

前面讲了面向类与对象的继承,知道了继承是一种什么“是”什么的关系。然而类与类之间还有另一种关系,这就是组合先来看两个例子:先定义两个类,一个老师类,老师类有名字,年龄,出生的年,月和日,所教的课程等特征以及走路,教书的技能。class Teacher: def __init__(self,name,age,year,mon,day): self.name=n...

2018-11-29 10:11:18 88

转载 python开发-实现redis中的发布订阅功能

redis中的发布/订阅模型是一种消息通信模式,今天聊一下在python中实现简单的发布订阅功能。实现方式一: redis_helper.py: 封装发布订阅方法代码如下

2018-11-28 10:38:00 389

转载 机器学习之数据归一化

器学习中,数据归一化是非常重要,如果不进行数据归一化,可能会导致模型坏掉或者训练出一个奇怪的模型。为什么要进行数据归一化现在有一个训练数据集,包含两个样本,内容如下:样本1 1 200 样本2 5 100 以 k-近邻算法为例,“发现时间”的数值比“肿瘤大小”的数值大很多,样本间的距离被“发现时间”主导,训练出来的模型主要由“发现时间”影响,甚至“肿瘤大...

2018-11-28 10:36:54 224

转载 python学习笔记--分支、循环、条件与枚举

表达式表达式(Expression)是运算符(operator)和操作数(operand)所构成的序列代码如下

2018-11-28 10:35:48 104

转载 【Python实战】用Scrapyd把Scrapy爬虫一步一步部署到腾讯云

将我们的爬虫部署到腾讯云服务器上面。废话不多说,我们就来实战操作吧。这里选择什么云服务都是可以的,阿里云,AWS,腾讯云,其他云都是没有问题的。部署方法基本一样,这里为了方便,所以笔者选择了腾讯云来做讲解。既然我们选择了腾讯云,首先去腾讯云的官网,注册登录一下。点击复制https://cloud.tencent.com/当你看到这篇文章的时候,我不知道腾讯云的优惠是怎样的,反正...

2018-11-27 10:32:13 680

转载 用Python实现读写锁

Python 提供的多线程模型中并没有提供读写锁,读写锁相对于单纯的互斥锁,适用性更高,可以多个线程同时占用读模式的读写锁,但是只能一个线程占用写模式的读写锁。通俗点说就是当没有写锁时,就可以加读锁且任意线程可以同时加;而写锁只能有一个线程,且必须在没有读锁时才能加上。简单的实现,代码...

2018-11-27 10:23:45 855

转载 进程、线程、多线程相关总结

一、说说概念1、进程(process)狭义定义:进程就是一段程序的执行过程。广义定义:进程是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。简单的来讲进程的概念主要有两点:第一,进程是一个实体。每一个进程都有它自己的地址空间,一般情况下,包括文本区域(text region)、...

2018-11-27 10:21:54 71

转载 python加密与解密,加签与验签

在与第三方服务对接时,加密与解密,加签与验签是这个过程中的关键一步 一般情况下,对接服务中会有两对公私钥。使用对方公钥进行加密,使用自己私钥进行加签。传回来的数据,使用自己的私钥解密,使用对方的公钥验签。 代码如下 ...

2018-11-26 10:13:44 356

转载 Python中的单例模式的几种实现方式的及优化

Python中的单例模式的几种实现方式的及优化 阅读目录(Content)单例模式单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在。当你希望在整个系统中,某个类只能出现一个实例时,单例对象就能派上用场。比如,某个服务器程序的配置信息存放在一个文件中,客户端通过一个 AppConfig 的类来读取配置文件的信息...

2018-11-26 10:12:05 84

转载 python的序列化和反序列化

1. 什么是序列化?当程序运行时,所有的变量或者对象都是存储到内存中的,一旦程序调用完成,这些变量或者对象所占有的内存都会被回收。而为了实现变量和对象持久化的存储到磁盘中或在网络上进行传输,我们需要将变量或者对象转化为二进制流的方式。而将其转化为二进制流的过程就是序列化。2. 什么是反序列化而反序列化就是说程序运行的时候不能从磁盘中进行读取,需要将序列化的对象或者变量从磁盘中转移到内存...

2018-11-26 10:10:46 97

转载 python3 urllib 详解

本文主要讲解 Python 3 中的 urllib 库的用法。urllib 是 Python 标准库中用于网络请求的库。该库有四个模块,分别是urllib.request,urllib.error,urllib.parse,urllib.robotparser。其中urllib.request,urllib.error两个库在爬虫程序中应用比较频繁。那我们就开门见山,直接讲解这两个模块的用法。...

2018-11-23 10:28:41 242

转载 爬虫实战之模拟登陆Github

这里不讨论用 Github API 的情况,仅仅以 Github 来说明模拟登陆先尝试用真实浏览器登陆,登陆成功后在开发者工具的 Network 选项卡中捕获 Session 文件。可以看到,登陆所需要的数据不仅仅是 email(或用户名) 和密码,还需要其它的 3 个字段,而这 3 个字段普通用户在真实浏览器中是无法填写的(也无需填写,这仨字段会自动附加到表单中提交)。其中的 com...

2018-11-23 10:26:26 421

转载 python----生产者消费者模型

生产者消费者模型具体来讲,就是在一个系统中,存在生产者和消费者两种角色,他们通过内存缓冲区进行通信,生产者生产消费者需要的资料,消费者把资料做成产品。代码如下...

2018-11-23 10:24:22 109

转载 Python 代码优化技巧

由于编辑器不兼容,附上原文链接

2018-11-22 10:32:29 105

转载 浅析 Python 的类、继承和多态

原文链接

2018-11-22 10:26:52 76

原创 python中的复制,浅拷贝和深拷贝

在python中,对象赋值实际上是对象的引用。当创建一个对象,然后把它赋给另一个变量的时候,python并没有拷贝这个对象,而只是拷贝了这个对象的引用代码:...

2018-11-22 10:23:01 97

转载 自然语言处理真实项目实战

本文根据实际项目撰写,由于项目保密要求,源代码将进行一定程度的删减。本文撰写的目的是进行公司培训,请勿以任何形式进行转载。由于是日语项目,用到的分词软件等,在中文任务中需要替换为相应的中文分词软件。自然语言处理真实项目实战...

2018-11-21 10:52:59 3251

原创 爬虫基础练习一 爬取豆瓣电影TOP250

这是一个很好的新手练习项目,爬取豆瓣top250的电影,并分别记录排名、片名、导演、主演、评论等信息,保存在一个txt文档里。对新手来说,难点部分在于如何找到并成功跳转到下一页,并且在最后一页的时候识别出来并停止爬虫。爬虫基础练习一 爬取豆瓣电影TOP250...

2018-11-21 10:51:49 626

转载 Python中的闭包

Python中的闭包不是一个一说就能明白的概念,但是随着你往学习的深入,无论如何你都需要去了解这么一个东西。Python中的闭包

2018-11-21 10:50:11 350

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除