自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

莫莫先生的博客

GoodGoodStudy，DayDayUp！哈哈哈

原创总数量超过五十个，史上最全的爬虫项目集合

五十三个爬虫项目集合，可以说是史上较大的一个爬虫项目集合，该项目集合可以让你由浅入深的学习爬虫，也可以学习借鉴他人完整的爬虫项目，一次吃个饱，收藏一下也不亏

2020-01-21 22:12:24 11864 3

原创 HTTP状态代码速查表

HTTP状态代码速查表

2020-01-15 20:09:18 254

原创 nginx: [emerg] host not found in upstream “xxx.nginx.com“ in xxx/conf/nginx.conf:xx

nginx: [emerg] host not found in upstream "xxx.nginx.com" in xxx/conf/nginx.conf:xx...

2020-12-12 23:02:49 1118

原创设置PyCharm背景图片

更换PyCharm背景，换个背景，换个心情写代码，每天都有好心情。

2020-04-13 15:52:35 8679 6

原创执行git commit命令时提示"Please tell me who you are."

执行git commit命令时提示"Please tell me who you are."

2020-04-12 09:58:48 1460

原创初窥数据分析之51job网职位分析项目

scrapy对51job网职位进行爬取，用pandas进行分析，pycharts进行可视化。

2020-04-09 15:05:25 1236 15

原创 Pandas之iloc、loc

ilocloc

2020-04-02 13:34:19 12620 1

原创 “疫”来风雨声，全球知多少，且看全球疫情分析

对全球疫情数据进行分析，动态地图展示全球疫情的发展动向，其他折线图分析各国疫情的具体态势。

2020-03-31 18:50:19 1884 21

原创 Pandas之unique和nunique傻傻分不清楚

unique 返回的是所有唯一值的数组，nunique 返回的是所有唯一值的计数总和。

2020-03-27 11:41:00 1277

原创 Pandas练习

Pandas练习题

2020-03-26 19:33:27 2706

原创笔趣阁爬虫（2020重制版），贴心的操作，谁用谁知道

笔趣阁爬虫（2020重制版），谁用谁知道，人性化设置，多进程爬取小说内容，速度极快，体验感甚佳

2020-03-26 12:23:16 6015 14

原创 Ubuntu18安装Anaconda

在Ubuntu18上安装Anaconda，操作简单，记录只为加深印象

2020-03-24 19:00:19 1339

原创配置Spark后续操作，连接Hive

前文：Ubuntu14从安装虚拟机开始配置Spark环境一、Hadoop分布式实例./bin/hdfs dfs -mkdir -p /user/hadoop./bin/hdfs dfs -mkdir ./input./bin/hdfs dfs -put /home/hadoop/下载/*.txt input./bin/hdfs dfs -ls二、spark支持hive的版本问...

2020-03-24 10:02:45 753

原创 Scrapy爬取知乎Python专题精华，连答主头像都给爬下来，不放过一切

Scrapy爬取知乎Python专题精华，主要有两个知识点，1、Scrapy自带的图片管道爬取图片；2、Scrapy多个item分别使用不同的pipeline进行处理。

2020-03-18 19:57:25 1111 4

原创 Jupyter快捷键-笔记小本

Jupyter的快捷键，方便自己，方便大家。

2020-03-17 08:54:45 153

原创安装git，解决"git 不是内部或外部命令，也不是可运行的程序"问题

安装git，解决"git 不是内部或外部命令，也不是可运行的程序"问题

2020-03-16 20:46:43 20830 10

原创我与Scrapy的初次相识，理论+实战入门Scrapy

记录一下初次做Scrapy项目的磕磕绊绊，我用这些磕磕绊绊助你入门Scrapy。

2020-03-13 08:05:37 1939 1

原创我安装pyecharts时的曲曲折折

安装pyecharts血泪史，让大家知道下我走过的坑，我三顾pyecharts而不得，望推广，少走冤枉路

2020-03-08 08:38:30 586 7

原创 Ubuntu14从安装虚拟机开始配置Spark环境，步骤十分详细，步步配图

本文集成了以下内容：1.ubuntu虚拟机的安装，以及更换虚拟机下载源的方法;2.配置Java环境，解决Xftp中文乱码的方法；3.配置scala环境；4.配置hadoop环境（伪分布式）；5.配置spark环境（单机模式）。

2020-02-23 18:27:52 3782 1

原创 Anaconda安装Scrapy框架

conda install scrapy即可，愿意点进来看我絮叨一会也行呀，开心

2020-02-21 06:55:06 1934

原创爬虫练习-爬取新浪微博信息并生成词云图

爬取新浪微博 "战疫情" 版块微博信息，并将信息内容存储为文本格式，且生成相应的词云图。

2020-02-08 11:34:21 4136 10

原创 Anaconda3安装jieba分词和wordcloud词云组件(2020.2.6)

目录前言一、安装jieba分词库（一）第一步、下载安装包（二）第二步，运行setup.py二、安装wordcloud词云库（一）第一步、下载安装包（二）第二步、输入指令安装最后前言jieba是优秀的中文分词第三方库，安装后可以使用其来对中文文本进行分词。而wordcloud，见名知意“词云”，wordcloud是基于Python的词云生成类库，以词语为基本单位，更加直观艺术的展示文本。由wor...

2020-02-06 15:30:52 4057

原创 selenium.common.exceptions.WebDriverException，导入selenium时出现的webDriver问题

问题：selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home

2020-02-05 10:40:30 1469 1

原创爬虫练习-爬取拉勾网招聘信息（2020.2.2）

应对AJAX动态加载，并应用表单的交互技术，爬取爬取拉勾网招聘信息，解析网页返回的json数据，并将爬取的数据存储于MongoDB数据库中。

2020-02-02 16:27:09 6187 14

原创爬虫练习-爬取简书网用户动态信息（应对AJAX）

应对AJAX动态加载，爬取简书网用户动态信息，并将爬取的数据存储于MongoDB数据库中

2020-01-21 21:31:58 770

原创爬虫练习- 爬取转转网二手市场商品信息

使用多进程爬虫方法爬取转转网二手市场商品信息，并将爬取的数据存储于MongoDB数据库中

2020-01-18 21:33:01 1678

原创爬虫练习-爬取简书网热评文章

使用多进程爬虫方法爬取简书网热评文章，并将爬取的数据存储于MongoDB数据库中

2020-01-17 12:00:40 1100

原创 Can't connect to MySQL server on 'localhost' ([WinError 10061] 由于目标计算机积极拒绝，无法连接。)

Can't connect to MySQL server on 'localhost' ([WinError 10061] 由于目标计算机积极拒绝，无法连接。)

2020-01-15 12:42:56 11410 6

原创记录-MySql随机读取N条数据

MySql随机读取N条数据

2020-01-14 21:22:54 166

原创 Python package里的init.py的简析和用法说明

Python package里的__init__.py的简析和用法说明

2020-01-09 10:17:28 8854 3

原创 Linux 运行、查看、关闭后台程序的命令

Linux 下后台运行程序，查看和关闭后台运行程序

2020-01-07 14:24:07 3956

原创爬虫练习-爬取豆瓣网图书TOP250的数据

爬取豆瓣网图书TOP250的数据，书名、链接、作者、出版社、出版时间、价格、评分、评语，并将数据存储于CSV文件中

2020-01-07 10:00:48 12153 10

原创在Centos7云服务器中下载并安装的Anaconda3 Python

下载并安装Linux的Anaconda Python

2020-01-07 09:24:27 508

原创基于SSM框架的web入门项目(八)终章·学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1，终章

2020-01-05 08:49:54 206

原创爬虫练习-爬取豆瓣电影TOP250的数据

前言：爬取豆瓣电影TOP250的数据，并将爬取的数据存储于Mysql数据库中

2020-01-04 17:58:12 3344 1

原创 MyEclipse中引入jquery.min.js文件报错

myeclipse中引入jquery.min.js文件报错

2020-01-04 15:01:49 408 1

原创基于SSM框架的web入门项目(七)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 13:56:43 257

原创基于SSM框架的web入门项目(六)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 13:06:46 180

原创基于SSM框架的web入门项目(五)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 10:31:44 177

原创基于SSM框架的web入门项目(四)学习记录

配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1

2020-01-04 09:56:57 202

Pandas练习.ipynb

原本该网站共有四部分，我整一起了。https://mlln.cn/2018/08/23/pandas数据分析100道练习题-第四部分/

2020-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除