自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 C语言实现单链表反转

最近在考研复习,记录一下基础的数据结构算法,有事没事翻一翻,以防忘了自己写了个翻转链表算法,感觉要比别人的要通俗易懂些void Reverse(List *L){ //分别是当前节点,直接前驱节点,直接后继节点 LNode *current, *pre, *pnext; //初始化 current = L -> next; pre = NU...

2018-09-20 17:09:31 10712 1

原创 python循环定时中断执行某一段程序的方法

问题说明  最近在写爬虫,由于单个账号访问频率太高会被封,所以需要在爬虫执行一段时间间隔后自己循环切换账号所以就在想,有没有像单片机那样子设置一个定时中断,再定义一个中断入口,这样子每隔一段时间执行一次中断当然不能用sleep,这样子整个进程就停在这了,而不是接着爬数据解决方法用到threading的Timer,也类似单片机那样子,在中断程序中再重置定时器,设置中断,pytho...

2018-08-22 09:40:58 11257 1

原创 关于使用threadpool时的巨坑:报错result = request.callable(*request.args, **request.kwds)

本来想写一个按广度优先爬取所有qq的一些信息和说说,计划线程池来实现多线程思路:待爬取队列出对200个qq,待爬取队列的组成元素是元组, 即(qq1, depth)局部代码如下 #开始出队20线程爬数据,这里不使用threading的原因是每次出队20个线程执行都要join,20个线程中只要还剩一个没执行完,在其他的都要 #等,效率太慢 ...

2018-08-15 17:17:04 939

原创 爬虫(三)生成qq好友关系网(3)—处理数据并将数据可视化

三. 终于写到了最后一篇啦第二步看这里:我是第二步嘻嘻嘻开源地址:是的没错 我是就那个开源 3.1 分析数据得到了第二步的两个文件:comment.txt和like.txt每个文件每一行都是这种格式: A$|$B而我们想要的好友关系网就是数据结构中的图,我们这里的图采用三元组的思想来存储,即 节点a,节点b,权值所以我们根据已经得到的两个文件在生成个 relation...

2018-08-07 17:43:58 2988

原创 爬虫(三)生成qq好友关系网(2)—获取好友空间评论点赞情况

二. 获取好友空间评论点赞情况到了最麻烦的一步了github地址:嘤嘤嘤我就是那个地址,点我点我上一篇看这里: 看我看我看我首先我们得想好我们要啥数据,我们要得到好友之间的关系值,那双方点赞和评论的次数越多,那么双方的关系值就应该越高,所以我们完成这个小项目就只要得到评论和点赞的次数然后我们得想好数据如何存储,是写进数据库呢,还是按照一定的格式存储为txt文件保存在本地,本文...

2018-08-07 15:39:41 1927 2

原创 爬虫(三)生成qq好友关系网(1)—登录并获得好友列表

本文目标  1.使用selenium实现账号密码登录qq空间  2.使用多线程爬取qq好友的说说评论点赞情况保存至本地  3.使用echarts将数据可视化开源地址:qq好友关系爬虫这是帮我同学做的他的qq好友关系网效果图,觉得他的关系网络比较好看,有特点,所以就用他的了,连线代表两人之间有联系,线的粗细代表两人关系的好的程度,为了显示效果和隐私就把名字给去了 最开...

2018-08-07 13:55:43 10800 3

原创 爬虫(二)实现qq空间的自动评论和自动点赞

会抓个网页总感觉还不够,平时在空间里经常会遇到秒赞或者是秒评论的,现在也可以自己用爬虫在qq空间得到需要的信息,再向特定的url发送http请求就可以做到自动评论和点赞了,使用的cookie登录,好像有点low,尝试过账号密码登陆,但没成功,那就将就着吧,以后再来研究 1.1   首先先用cookie登录qq空间,抓取到页面的内容,用pc端打开自己的qq空间,按F12进入开发者模式,可以看...

2018-07-23 15:33:09 12988 2

原创 爬虫(一)抓取百度页面的内容

最近在实习,导师又没得项目让我一起做东西,就自己坐在一边瞎鼓捣东西那闲着也是闲着,想来写写爬虫爬虫百度百科上的定义如下      网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。也就是从网页抓取自己想要的数据,得到的数据可以...

2018-07-23 14:12:58 7837

原创 Linux用户分类以及简单管理

1.1 用户信息存放在 /etc/passwd, 使用下面的指令查看cat /etc/passwdroot:x:0:0:root:/root:/bin/bashdaemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologinbin:x:2:2:bin:/bin:/usr/sbin/nologinsys:x:3:3:sys:/dev:/usr/sbin/nologins...

2018-06-30 14:43:11 3946

原创 Ubuntu16.04搜狗输入法安装

1. 首先下载搜狗输入法的linux版:https://pinyin.sogou.com/linux/,选择32位/64位2. 打开一个终端然后进入下载目录3.输入yng@yng:~/下载$ sudo dpkg -i sogoupinyin_2.2.0.0108_amd64.deb会显示sudo: 无法解析主机:yng[sudo] yng 的密码:(这里输自己的密码)(正在读取数据库 ......

2018-06-29 21:39:46 1078

原创 Leetcode 2.Add Two Numbers的c语言解决

// Definition for singly-linked list./* struct ListNode { int val; struct ListNode *next; };*/struct ListNode* addTwoNumbers(struct ListNode* l1, struct ListNode* l2) { //分配结果空...

2018-03-07 21:46:19 589 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除