自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据自留地的博客

让数据说话,微信公众号:【数据自留地】 专注于爬虫和数据

  • 博客(6)
  • 资源 (3)
  • 收藏
  • 关注

原创 爬虫:碰见字体反爬如何处理

目录THE BEGIN一 什么是字体反爬?二 如何解密1. 人工解密2.工具解密三 建立映射关系四 解密THE BEGIN网页数据爬取可以简单分为三步:抓取页面,分析页面,存储数据。其中第一二步最为头疼,因为每个站点各有特色,你要不断检查网页结构寻找其规律,更不用说现在各种各样的反爬虫手段了。一般来说,大多数网站会从三方面反爬虫:用户请求,如...

2019-05-20 15:23:30 5331 4

原创 Python干货分享+百G资源放送!

人生苦短我学python自从进入大数据时代,python越来越火爆,自己也在学习的过程中感触颇多。这里我整理了这一年多以来的学习资料和学习路程,希望对正在学习python的你有所帮助。目录人生苦短我学python1.入门1. 廖雪峰Python教程2.菜鸟教程3.视频站点:网易公开课、慕课网2.练手1....

2019-05-15 11:15:30 453

原创 去哪儿网上海景点数据爬虫分析

盼望着盼望着,五一小长假终于到来在这四天假期里,相信有很多同学十分纠结,也许你想着出去浪,结果一出门......可是这么多天假期,怎能甘心呆在宿舍做个快乐肥宅?我们爬取了去哪儿网,获得了上海1500+景点数据(不得不说原来上海有这么多可以玩的地方),用数据来向你分析上海景点。01数据获取和展示 部分代码 部分数据一览 ...

2019-05-01 13:07:33 2623 1

原创 爬虫与数据分析:在分析完实习僧5000条数据后,我来告诉你该怎样找实习

目录1)引言2)数据获取与分析数据获取工具部分代码3)哪些职位需求比较大?4)哪些地方实习职位比较多4)哪些职位工资比较高5)工作时长6)总结1)引言俗话说金三银四,如今四月已快过一半,不知道想要找实习的小伙伴们是否收到了自己心仪的offer。实习作为迈入工作的第一步,它的重要性不言而喻,一份好的实习很大程度上决定了我们以后的职业规划。那...

2019-04-16 22:27:49 2392 2

原创 C和python关于多个运算符号的区别(个人理解)

对于 -1<2==1 的运算,C和Python得到的结果是不一样的,且C和Python ‘<’ 优先级都高于 ‘==’在C里,得到的结果是true#include<stdio.h>int main(){ if(-1<2==1) printf("true\n"); else printf("false\n"); return 0;}...

2018-12-28 14:16:55 274

原创 输入一个大于 2 的自然数,然后输出小于该数字的所有素数组成的列表

题目如下:输入一个大于 2 的自然数n,然后输出小于该数字的所有素数组成的列表        读完题目,首先我的想法是创建一个包含2—n的列表,然后从中筛选出是素数的数,将其从列表中移除即可。素数的判断简单,移除列表中的某个元素有三种常见方法,remove、pop、del        remove删除某个符合条件的元素,按值删除        pop和del是删除一个或多个元素,...

2018-12-20 19:01:53 28462

数学分析I 复习卷.pdf

数学分析I 复习卷.pdf

2019-08-17

python新浪微博爬虫,爬取微博和用户信息 (源码)

这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。 安装过程: 1.先安装Python环境,作者是Python 2.7.8 2.再安装PIP或者easy_install 3.通过命令pip install selenium安装selenium,它是自动测试、爬虫的工具 4.然后修改代码中的用户名和密码,填写你自己的用户名和密码 5.运行程序,自动调用Firefox浏览

2018-12-24

Qt QLabel滚动字幕.zip

Qt QLabel滚动字幕.zip亲测可用, 谢谢支持。

2018-12-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除