自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

莫莫先生的博客

GoodGoodStudy,DayDayUp! 哈哈哈

  • 博客(74)
  • 资源 (1)
  • 收藏
  • 关注

原创 总数量超过五十个,史上最全的爬虫项目集合

五十三个爬虫项目集合,可以说是史上较大的一个爬虫项目集合,该项目集合可以让你由浅入深的学习爬虫,也可以学习借鉴他人完整的爬虫项目,一次吃个饱,收藏一下也不亏

2020-01-21 22:12:24 11864 3

原创 HTTP状态代码速查表

HTTP状态代码速查表

2020-01-15 20:09:18 254

原创 nginx: [emerg] host not found in upstream “xxx.nginx.com“ in xxx/conf/nginx.conf:xx

nginx: [emerg] host not found in upstream "xxx.nginx.com" in xxx/conf/nginx.conf:xx...

2020-12-12 23:02:49 1118

原创 设置PyCharm背景图片

更换PyCharm背景,换个背景,换个心情写代码,每天都有好心情。

2020-04-13 15:52:35 8679 6

原创 执行git commit命令时提示"Please tell me who you are."

执行git commit命令时提示"Please tell me who you are."

2020-04-12 09:58:48 1460

原创 初窥数据分析之51job网职位分析项目

scrapy对51job网职位进行爬取,用pandas进行分析,pycharts进行可视化。

2020-04-09 15:05:25 1236 15

原创 Pandas之iloc、loc

ilocloc

2020-04-02 13:34:19 12620 1

原创 “疫”来风雨声,全球知多少,且看全球疫情分析

对全球疫情数据进行分析,动态地图展示全球疫情的发展动向,其他折线图分析各国疫情的具体态势。

2020-03-31 18:50:19 1884 21

原创 Pandas之unique和nunique傻傻分不清楚

unique 返回的是所有唯一值的数组,nunique 返回的是所有唯一值的计数总和。

2020-03-27 11:41:00 1277

原创 Pandas练习

Pandas练习题

2020-03-26 19:33:27 2706

原创 笔趣阁爬虫(2020重制版),贴心的操作,谁用谁知道

笔趣阁爬虫(2020重制版),谁用谁知道,人性化设置,多进程爬取小说内容,速度极快,体验感甚佳

2020-03-26 12:23:16 6015 14

原创 Ubuntu18安装Anaconda

在Ubuntu18上安装Anaconda,操作简单,记录只为加深印象

2020-03-24 19:00:19 1339

原创 配置Spark后续操作,连接Hive

前文:Ubuntu14从安装虚拟机开始配置Spark环境一、Hadoop分布式实例./bin/hdfs dfs -mkdir -p /user/hadoop./bin/hdfs dfs -mkdir ./input./bin/hdfs dfs -put /home/hadoop/下载/*.txt input./bin/hdfs dfs -ls二、spark支持hive的版本问...

2020-03-24 10:02:45 753

原创 Scrapy爬取知乎Python专题精华,连答主头像都给爬下来,不放过一切

Scrapy爬取知乎Python专题精华,主要有两个知识点,1、Scrapy自带的图片管道爬取图片;2、Scrapy多个item分别使用不同的pipeline进行处理。

2020-03-18 19:57:25 1111 4

原创 Jupyter快捷键-笔记小本

Jupyter的快捷键,方便自己,方便大家。

2020-03-17 08:54:45 153

原创 安装git,解决"git 不是内部或外部命令,也不是可运行的程序"问题

安装git,解决"git 不是内部或外部命令,也不是可运行的程序"问题

2020-03-16 20:46:43 20830 10

原创 我与Scrapy的初次相识,理论+实战入门Scrapy

记录一下初次做Scrapy项目的磕磕绊绊,我用这些磕磕绊绊助你入门Scrapy。

2020-03-13 08:05:37 1939 1

原创 我安装pyecharts时的曲曲折折

安装pyecharts血泪史,让大家知道下我走过的坑,我三顾pyecharts而不得,望推广,少走冤枉路

2020-03-08 08:38:30 586 7

原创 Ubuntu14从安装虚拟机开始配置Spark环境,步骤十分详细,步步配图

本文集成了以下内容:1.ubuntu虚拟机的安装,以及更换虚拟机下载源的方法;2.配置Java环境,解决Xftp中文乱码的方法;3.配置scala环境;4.配置hadoop环境(伪分布式);5.配置spark环境(单机模式)。

2020-02-23 18:27:52 3782 1

原创 Anaconda安装Scrapy框架

conda install scrapy即可,愿意点进来看我絮叨一会也行呀,开心

2020-02-21 06:55:06 1934

原创 爬虫练习-爬取新浪微博信息并生成词云图

爬取新浪微博 "战疫情" 版块微博信息,并将信息内容存储为文本格式,且生成相应的词云图。

2020-02-08 11:34:21 4136 10

原创 Anaconda3安装jieba分词和wordcloud词云组件(2020.2.6)

目录前言一、安装jieba分词库(一)第一步、下载安装包(二)第二步,运行setup.py二、安装wordcloud词云库(一)第一步、下载安装包(二)第二步、输入指令安装最后前言jieba是优秀的中文分词第三方库,安装后可以使用其来对中文文本进行分词。而wordcloud,见名知意“词云”,wordcloud是基于Python的词云生成类库,以词语为基本单位,更加直观艺术的展示文本。由wor...

2020-02-06 15:30:52 4057

原创 selenium.common.exceptions.WebDriverException,导入selenium时出现的webDriver问题

问题:selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home

2020-02-05 10:40:30 1469 1

原创 爬虫练习-爬取拉勾网招聘信息(2020.2.2)

应对AJAX动态加载,并应用表单的交互技术,爬取爬取拉勾网招聘信息,解析网页返回的json数据,并将爬取的数据存储于MongoDB数据库中。

2020-02-02 16:27:09 6187 14

原创 爬虫练习-爬取简书网用户动态信息(应对AJAX)

应对AJAX动态加载,爬取简书网用户动态信息,并将爬取的数据存储于MongoDB数据库中

2020-01-21 21:31:58 770

原创 爬虫练习- 爬取转转网二手市场商品信息

使用多进程爬虫方法爬取转转网二手市场商品信息,并将爬取的数据存储于MongoDB数据库中

2020-01-18 21:33:01 1678

原创 爬虫练习-爬取简书网热评文章

使用多进程爬虫方法爬取简书网热评文章,并将爬取的数据存储于MongoDB数据库中

2020-01-17 12:00:40 1100

原创 Can't connect to MySQL server on 'localhost' ([WinError 10061] 由于目标计算机积极拒绝,无法连接。)

Can't connect to MySQL server on 'localhost' ([WinError 10061] 由于目标计算机积极拒绝,无法连接。)

2020-01-15 12:42:56 11410 6

原创 记录-MySql随机读取N条数据

MySql随机读取N条数据

2020-01-14 21:22:54 166

原创 Python package里的__init__.py的简析和用法说明

Python package里的__init__.py的简析和用法说明

2020-01-09 10:17:28 8854 3

原创 Linux 运行、查看、关闭后台程序的命令

Linux 下后台运行程序,查看和关闭后台运行程序

2020-01-07 14:24:07 3956

原创 爬虫练习-爬取豆瓣网图书TOP250的数据

爬取豆瓣网图书TOP250的数据,书名、链接、作者、出版社、出版时间、价格、评分、评语,并将数据存储于CSV文件中

2020-01-07 10:00:48 12153 10

原创 在Centos7云服务器中下载并安装的Anaconda3 Python

下载并安装Linux的Anaconda Python

2020-01-07 09:24:27 508

原创 基于SSM框架的web入门项目(八)终章·学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1,终章

2020-01-05 08:49:54 206

原创 爬虫练习-爬取豆瓣电影TOP250的数据

前言:爬取豆瓣电影TOP250的数据,并将爬取的数据存储于Mysql数据库中

2020-01-04 17:58:12 3344 1

原创 MyEclipse中引入jquery.min.js文件报错

myeclipse中引入jquery.min.js文件报错

2020-01-04 15:01:49 408 1

原创 基于SSM框架的web入门项目(七)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 13:56:43 257

原创 基于SSM框架的web入门项目(六)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 13:06:46 180

原创 基于SSM框架的web入门项目(五)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 10:31:44 177

原创 基于SSM框架的web入门项目(四)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 09:56:57 202

Pandas练习.ipynb

原本该网站共有四部分,我整一起了。https://mlln.cn/2018/08/23/pandas数据分析100道练习题-第四部分/

2020-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除