自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (3)
  • 收藏
  • 关注

原创 Flask的登录

​2019/8/12 下午4:17:39 Flask的登录创建以下文件夹appmanager.pyconf__init__.pyconfig.pysettings.pymapperforms__init__.pylogin_form.pymodels__init__.pyuser_model.pyFlask创建一个web应用,相当于a...

2019-08-12 16:19:19 493

原创 构建自己的代理池

目录前期准备/使用的框架模块基本流程代码实战config.pydb.pycrawler.pyvalid_proxy.pycrawl_proxy.pyapi.pyrules.py部署流程对于学习爬虫来说,ip被禁几乎是常见的事。因此在爬取业务中,使用代理ip几乎是常态。但是对市面上的代理ip的服务,对于个人爬虫学习者来说,价格高昂。即使淘宝...

2019-07-09 18:14:25 671

原创 网络编程笔记一(nginx,wsgi,flask)

文章目录简要理解一个请求到flask应用的过程Web服务器层WSGI层Web网络框架层nginx 的作用反向代理负载均衡其他简要理解一个请求到flask应用的过程客户端从发送一个 HTTP 请求到 Flask 处理请求,分别经过了 web服务器层,WSGI层,web框架层,这三个层次。不同的层次其作用也不同,下面简要介绍各层的作用。Web服务器层对于传统的客户端 - 服务器架构,其请求的...

2019-06-17 23:59:32 154

原创 计算机网络面试题(一)

文章目录理解一个完整的网络请求过程0. 判断是否为合法URL1. 解析DNS2. 建立TCP/IP连接发送HTTP请求进行资源的访问释放连接浏览器进行资源渲染展示理解一个完整的网络请求过程0. 判断是否为合法URL一个合法的URL应包含三部分协议 http/httpsdns 域名router 路由1. 解析DNSDNS 由一个顶级域和若干个子域构成,子域又可以划分成各种子域的集合...

2019-06-07 08:49:58 161

原创 水库采样-随机数生成

构造随机生成器说明什么是随机数构造属于特定的随机数生成器应用一:构造随机数生成数应用二:水库抽样说明本文所说的均为伪代码,代码实现根据自己习惯语言编写.什么是随机数随机数是不同随机试验的结果。它在不同统计领域均有广泛地应用,比如从统计样本中抽取一定数量的个体。产生随机数有多种不同的方法,而这些方法被称为随机数生成器。随机数的性质是等概率,不可预测,例如最简单随机数整数生成器求模运算。 伪代...

2019-04-26 23:51:54 260

翻译 MySQL 笔记二(连接池的简要介绍)

文章目录简要原理优点注意要点1. 连接池中到底应该放置多少连接,才能使系统的性能最佳?2. 如何确保连接池中的最小连接数呢?dbcp参数设置c3p0c3p0与dbcp区别python-SQLalchemy使用用法参数设置原文: https://www.cnblogs.com/aspirant/p/6747238.html简要最小连接数:是连接池一直保持的数据库连接,所以如果应用程序对数据库...

2019-03-29 23:01:03 533

翻译 MySQL 笔记一(引擎的简要介绍)

文章目录InnoDBACID事务原子性(Atomicity)一致性(Consistency)隔离性(Isolation)持久性(Durability)行级锁MyISAM表级锁存储格式静态表动态表压缩表缺点Memory索引注意要点Merge使用要点常见问题1)建表时UNION指明的子表如果存在相同主键的记录会怎么样?2)若MREGE后存在重复主键,按主键查询会是什么结果?3)直接删除一个子表会出现什...

2019-03-19 21:33:51 117

转载 python 实例方法,类方法 以及静态方法

对于python的初学者,了解实例方法,类方法 以及静态方法并不是特别的重要,但是若想更好的利用python作为自己的编程工具,则不得不学。在此先说明一下,有人会问python2.7.x以及python3.x先学哪个好,其实我觉得两者并没有太多的区别。在许多公司都会沿用python2.7.x,这是历史原因。虽说官方建议python3,但是不代表python2比python3性能差,而且github...

2019-01-07 23:51:36 123

原创 python3 多进程, 多线程, 协程性能对比 以及GIL锁解释

描述对于python来说, 多线程是python的软肋。在官方文档表明,根据程序的不同类型,如是I/O密集型,CPU密集型,分别使用多线程,多进程会使性能达到最佳。本文的主要目的是笔者在面试过程中,提及到线程,进程,协程对于爬虫来说,哪个性能会更好(笔者本人认为是进程加协程二者配合会达到更好的效果)。希望通过本文来让其他人对于爬虫的线程,进程,协程使用有更深的理解。 本文涉及的环境模块...

2019-01-06 21:58:47 2689 2

原创 使用最大逆向法,利用python进行简易中文分词

首先进行分词所需要的基本设置就是“词库”,而网上开源的词库有很多,例如github里面的chinese词库和清华大学开源中文词库,这些都是免费下载开源的。而且下载及其简单,所以你在网页可以直接下载,若是你已经学过爬虫,也可以进行爬下来。在这里我只下载类清华大学的food词库,这个程序也只能匹配水果食物等的专有名词。以下是程序#!/usr/bin/env python#-*- co

2017-08-03 16:32:17 594

xhs5.22.0.apk

小红书app旧版本

2021-05-21

Microsoft Visual C++ 14.0.zip

针对python3.* pip安装包提示Microsoft Visual C++ 14.0 is required错误,提示所需的安装插件

2019-06-22

中关村手机爬虫

爬取页面手机信息,并且通过mysql进行插入。方便查询!

2018-05-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除