自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ZZPHOENIX的博客

欢迎访问个人网站: https://ramondz.cn

  • 博客(25)
  • 问答 (1)
  • 收藏
  • 关注

原创 几行代码在Django搭建的网站中显示markdown中的latex数学公式

     在自己用Django搭的博客网站上写博客的时候一直很难受,因为基本的markdown模块好像并不支持latex。网上虽然能找到方法但是我很懒,不想再为这个修改很多代码了。之前为了在博客里面显示latex公式一直都是在这个网站[codcogs](http://latex.codecogs.com/上把公式输进去再复制产...

2019-04-14 20:20:21 1085

原创 算法思考-求乱序序列的中位数

题目:求乱序序列的中位数方法一        最容易想到的解法,先将序列排序,再求出中位数Python代码:def get_median_1(l): l = quick_sort(l) # 这里没有使用自带的sorted函数是为了之后直观地比较两种算法的区别 if len(l)%2 == 0: return (l[int(len...

2019-03-20 01:41:24 1726

原创 算法思考-GooglePageRank算法

算法思考-GooglePageRank算法

2019-03-05 23:17:30 271

原创 算法思考-求最大公约数和最小公倍数

题目:求两数的最大公约数和最小公倍数关键在于求最大公约数,求出最大公约数后就可以算出最小公倍数方法一        简单的暴力寻找:设p为两数m,n中的较小数,设置死循环:若p同时整除m和n,则p为m和n的最大公约数,退出循环;否则p-1,返回步骤1C++代码:#include <iostream>using name...

2019-03-05 23:16:23 284

原创 算法思考-topk问题堆排序、快速排序比较

题目:分析求解topk(big)问题时 堆排序 和 快速排序 的使用场景快速排序求解       这种算法利用了快速排序的主要思想:每次调用快速排序的partition函数后将会得出一个数n的最终位置,比较n及其右边所有数的总个数与目标个数k若大于k,则对数n右边的数构成的数组调用partition函数;若等于k,则说明n及其右边的数就是我们想要得...

2019-02-27 22:26:44 1605

原创 算法思考-最大子序列和

题目:对给定的某序列,给出方案求 子序列和 最大的子序列并进行评价一共有四种方法:求出以每一个元素为起点的每一个子序列的和,再进行比较,找出其中的最大值;求出以每一个元素为起点的最大子序列的和,再进行比较,找出其中的最大值;采用分治法,利用递归进行求解;利用动态规划,遍历序列,实时更新最大子序列和。方法一时间复杂度为O(N3),方法二时间复杂度为O(N2),方法三时间...

2019-02-27 17:51:45 228

原创 NumPy基础

Numpy基础建议与Jupyter Notebook配合阅读import numpy as np概述NumPy特点:内部数据存储在连续的内存块上算法库使用C语言编写针对全量数组进行复杂运算,不用使用循环NumPy方法比Python方法 快 10~100倍,使用 更少 的内存多维数组对象生成ndarraynp.array – 由列表生成数组data1 = [1,2,3...

2019-02-20 10:13:29 189

原创 pandas入门

pandas入门建议与Jupyter Notebook配合使用import pandas as pd数据结构Series – 一维数据表obj = pd.Series([1,3,5,7,9])obj左边第一列为index,默认为range(n),可以自己设置obj = pd.Series([1,3,5,7,9], index=['a','b','c','d','e'])ob...

2019-02-20 10:12:12 202

原创 Matplotlib 入门

基本绘图import matplotlib.pyplot as pltplt.ylabel("Grade") #设置Y轴标签plt.plot([1,5,9,10,12,15], [3,2,7,9,0,1]) #(X轴,Y轴)plt.savefig('test', dpi=600) #另存为PNG文件,每英寸像素点为600plt.axis([-1, 10, 0, 12]...

2018-11-15 16:52:27 208

转载 Pycharm2018.2永久破解(转)

 Pycharm是一款非常好用的python IDE,提供专业版和社区版,就像eclipse和myeclipse一样,专业版是收费的,而社区版是免费的但功能就没有专业版的功能强大。1.Pycham下载       https://www.jetbrains.com/pycharm/download/#section=windows直接下载专业版2.安装   这里就不必细说,...

2018-11-13 13:02:19 815 1

原创 Django开发网站步骤

设计原型业务流程功能模块前端布局后端模型个人博客网站1.项目管理a.IDEb.本地虚拟环境c.Git/Github2.前端开发a.jQueryb.html+javascript+CSSc.Bootstrapd.ajax3.后端开发a.博客管理和展示b.用户登录和注册c.评论和回复d.点赞4.数据库和服务器a.MySQLb.Linuxc.网站部...

2018-11-09 12:55:55 706

原创 Django 定制后台和修改模型

1.定制admin后台1).进入models.py在数据模型类中定义函数: def __str__(self): return self.title这样就在后台管理Article模型时将显示文章的标题:2).进入admin.pya. 定义一个数据模型的专属类继承 admin.ModelAdmin类,其中设置将要显示的详细信息组成的元组/列表(由于后期无需修改,...

2018-11-09 12:54:59 683

转载 几种压缩算法实现原理详解

gzip 、zlib以及图形格式png,使用的压缩算法都是deflate算法。从gzip的源码中,我们了解到了defalte算法的原理和实现。我阅读的gzip版本为 gzip-1.2.4。下面我们将要对deflate算法做一个分析和说明。首先简单介绍一下基本原理,然后详细的介绍实现。1 gzip 所使用压缩算法的基本原理gzip 对于要压缩的文件,首先使用LZ77算法的一个变种进行压缩,对...

2018-11-05 23:56:26 1239

原创 Django——url和views

Views不同的request请求由不同的views.py中的函数响应格式如下:def 名称(request): return render(request, 调用的html静态文件, {传入html文件的参数})编写完成后如下:def index(request): #显示简单的“Hello World”,一般很少用 #return HttpResponse(...

2018-11-02 14:36:33 379

原创 Django——数据库配置和数据模型创建

数据库配置settings.pyDATABASES = { #第一个数据库 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'blog', 'USER': 'root', 'PASSWORD': 'Zwp0816...', 'HO...

2018-11-02 00:33:57 187

原创 《精通Python网络爬虫》读书笔记—— Urllib库(1)

一、利用Urllib爬取网页1.导入对应模块:    因为Python 3.*版本中将urllib和urllib2合并为urllib,所以直接import urllib.request2.使用 urllib.request.urlopen(url)打开并爬取一个网页    这里将百度作为例子file = urllib.request.urlopen("http://ww...

2018-10-21 22:46:34 236

原创 《精通Python网络爬虫》读书笔记—— Urllib库(2)

一、利用Urllib爬取网页8.HTTP请求    HTTP协议请求主要分为6类:GET,POST,DELETE,PUT, HEAD, OPTIONS1). GET 请求    在淘宝上搜索Python后观察可以发现URL由‘http://www.taobao.com’变为了‘https://s.taobao.com/search?q=Python&imgfile=&amp...

2018-10-21 22:46:26 249

原创 Python+Selenium(+pymysql)实现自动听取慕课课程

 *这里实现的是超星在线学习平台上课程的自动听取,虽然最终成功了但是由于并不了解网站后台的监控机制,还是乖乖肉身听课吧(逃一、主体结构由于实现的功能并不是十分复杂,这里只构造了一个AutoStudent类来完成自动听课,主要分为四个模块:用户登录 选择课程 检测尚未完成的小节 自动听课二、详细步骤1.__init__()首先创建一个类并定义初始化函数,在此函数中定义...

2018-10-21 22:44:19 1954

原创 利用动态渲染页面对京东笔记本电脑信息爬取

写在前面之前写过一个爬取京东商品的Scrapy爬虫项目,但是里面价格及评论数是通过逆向工程法获得的,在不使用代理ip的情况下,在爬取一定数量的商品后会被持续要求输入验证码。所以这里写出利用动态页面渲染对京东商品价格及评论数爬取的方法。 在之前的项目中,构造特殊请求获得的数据有:价格评论数好评度但由于好评度需要进入单个商品的页面才能获取,而利用动态渲染页面爬取数据其实是...

2018-08-24 11:14:32 1066 2

原创 解析库使用

1)XPathXPath通过标签()提取信息→更适用于爬虫a.构造解析对象方法一:处理文本from lxml import etreetext = '''<ol class="carousel-indicators"> <li data-target="#myCarousel" data-slide-to="0" class="acti...

2018-08-23 09:31:07 295

原创 Python爬虫——查询英语四、六级成绩

今天出六级成绩,很多人在成绩出来之后的一段时间都查询不到自己的成绩。晚上有空就写了一个爬虫。首先进入查询四、六级成绩的网页,这里使用的是“http://cet.neea.edu.cn/cet”进入之后发现不能右键查看源代码,不过也没有关系,直接打开开发者工具 输入前两个信息后点击验证码输入框,发现出现两个新的GET请求 显然这是获取验证码的相关请求。点击第一个请求,可以发现验证...

2018-08-22 22:27:02 5753 10

原创 Scrapy框架基础

cmd操作指令 commands meaning bench Run quick benchmark test fetch Fetch a URL using the Scrapy downloader genspider Generate new spider using pre-defined templates runspider...

2018-08-21 23:11:32 234

原创 基本库的使用——requests

requests库1) GET请求基本操作import requestsurl = 'https://www.baidu.com'response = requests.get(url)添加参数,头信息params = { 'kw':'Python', 'page':'1'}headers = { 'user-agent':'...

2018-08-21 17:38:17 299

原创 基本库的使用——urllib库

urllib库1.导入对应模块:因为Python 3.*版本中将urllib和urllib2合并为urllib,所以直接import urllib.request2.使用 urllib.request.urlopen(url)打开并爬取一个网页这里将百度作为例子file = urllib.request.urlopen("http://www.baidu.c...

2018-08-21 10:10:51 277

原创 Scrapy框架爬虫项目:京东商城笔记本电脑信息爬取

一、创建Scrapy项目在cmd中输入一下指令创建一个新的scrapy项目及一个爬虫scrapy startproject JD_Goodscd JD_Goodsscrapy genspider -t basic goods jd.com二、容器设置在京东商城笔记本电脑分类下进入一个商品页面,在“”规格与包装”栏下可以看见该笔记本电脑的详细信息经过筛选,在item...

2018-08-10 21:36:13 2016

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除