自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 问答 (1)
  • 收藏
  • 关注

原创 用Python爬取《后浪》弹幕,绘制生成专属词云,看看“后浪们”都在评论些什么

请查收,最近B站献给新一代的青年宣言片。国家一级演员何冰走上舞台,以青年宣言《后浪》为词,认可、赞美与寄语年轻一代。在UP主们的青春混剪中,属于年轻人的光芒正在闪耀。“你们有幸 遇见这样的时代 但时代更有幸 遇见这样的你们”用Python爬取《后浪》弹幕,看看“后浪”都在评论些什么?一、找到评论链接进入B站《后浪》播放页面,按F12键后,刷新页面。评论链接在红色标记下对应的包,蓝线上方Request URL即为评论链接https://api.bilibili.com/x/v1/dm/list.s

2020-05-10 18:25:09 3161 23

原创 7-6 悄悄关注 (300分)

**7-6 悄悄关注 (300分)**新浪微博上有个“悄悄关注”,一个用户悄悄关注的人,不出现在这个用户的关注列表上,但系统会推送其悄悄关注的人发表的微博给该用户。现在我们来做一回网络侦探,根据某人的关注列表和其对其他用户的点赞情况,扒出有可能被其悄悄关注的人。输入格式:输入首先在第一行给出某用户的关注列表,格式如下:人数N 用户1 用户2 …… 用户N其中N是不超过5000的正整数,每个用户i(i=1, …, N)是被其关注的用户的ID,是长度为4位的由数字和英文字母组成的字符串,各项间以空

2020-09-29 09:16:16 164

原创 7-7 两个有序序列的中位数 (300分)

7-7 两个有序序列的中位数 (300分)已知有两个等长的非降序序列S1, S2, 设计函数求S1与S2并集的中位数。有序序列A0,A1​​ ,⋯,AN−1的中位数指A(N−1)/2的值,即⌊(N+1)/2个数(A​0为第1个数)。输入格式:输入分三行。第一行给出序列的公共长度N(0<N≤100000),随后每行输入一个序列的信息,即N个非降序排列的整数。数字用空格间隔。输出格式:在一行中输出两个输入序列的并集序列的中位数。输入样例1:51 3 5 7 92 3 4 5 6输出样

2020-09-29 09:13:37 283

原创 Python多线程爬虫之Queue

Python多线程爬虫实现多线程爬虫为什么要爬虫使用多线程?为了提高抓取数据效率有些网站对访问速度有限制, 这样网站可以可以开启多个线程, 每一个线程使用一个代理,去提取页面的一部分内容1、多线程的方法使用在python3中,主线程主进程结束,子线程,子进程不会结束 为了能够让主线程回收子线程,可以把子线程设置为守护线程,即该线程不重要,主线程结束,子线程结束t1 = threading.Thread(targe=func,args=(,))t1.setDaemon(True)t1.

2020-06-13 16:52:18 883

原创 爬取淘宝商品信息

import requestsimport redef getHTMLText(url): headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36", "cookie": "t=925dee34e81f413e4fef7a69c7f090

2020-05-11 18:01:56 755

原创 Python爬取豆瓣电影 Top 250

爬虫

2020-04-16 10:42:10 683

原创 Python爬取豆瓣电影TOP250改进

在本篇博客中,我们将使用requests+正则表达式(re)来爬取豆瓣电影TOP250电影榜单,获取每部电影的序号、片名、导演、编剧、主演、类型、制作国家/地区、语言、上映日期、片长、又名、豆瓣评分和剧情简介等内容。打开豆瓣Top250,分析URL的变化:发现Top250榜总共包含10页,每页25部电影,并且每一页的URL都是有规律的,如第2页的URL是https://movie.douban....

2020-04-16 09:42:54 1824

原创 星号三角形输出 Python123

描述读入一个整数N,N是奇数,输出由星号字符组成的等边三角形,要求:‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫ ‬第1行1个星号,第2行3个星号,第3行5个星号,依次类推,最后一行共N的星号。解析思路:看好题目要求,它的意思是说输入1,输出第一行1个星号且无空格;输入3,第一行...

2020-03-07 16:31:10 5996

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除