自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (9)
  • 收藏
  • 关注

原创 python编程实战-----飞机大战

飞机大战500行代码实现飞机大战import pygameimport sysfrom pygame.sprite import Spritefrom pygame.sprite import Groupfrom time import sleepimport pygame.font# 修改游戏的一些新设置class Settings(): """存储《外星人入侵》的所有...

2020-02-15 18:14:49 1152 1

原创 python爬虫实战之实时数据挖掘

实时数据挖掘目录实时数据挖掘序言1. 新浪财经实时数据挖掘实战1.1 获取网页源代码1.2 数据提取2. 东方财富网数据挖掘实战2.1 获取网页源代码2.2 编写正则表达式提取数据2.3 数据的清洗及打印输出2.4 实战代码3. 裁判文书网数据挖掘实战4. 巨潮资讯网数据挖掘实战4.1 获取网页源代码4.2 编写正则表达式提取数据4.3 数据清洗及打印输出4.4 实战代码结尾序言 通过使用S...

2020-01-25 10:01:42 3364

原创 python爬虫实战之百度新闻爬取

百度新闻信息爬取目录百度新闻信息爬取序言获取在百度新闻中搜索“阿里巴巴”的网页源代码编写正则表达式提取新闻信息数据清洗并打印输出实战完整代码序言 通过对百度新闻标题、链接、日期及来源的爬取,了解使用python语言爬取少量数据的基本方法。获取在百度新闻中搜索“阿里巴巴”的网页源代码 为了获得请求头,我们可以在谷歌浏览器中的地址栏中输入about:version,即可获得headers。...

2020-01-18 16:33:05 10253 7

原创 Python数据分析与挖掘实战学习笔记(3)

Chapter4 数据预处理目录Chapter4 数据预处理序言数据清洗缺失值处理异常值处理数据集成实体识别冗余属性识别数据变换简单函数变换规范化连续离散属性化离散化过程常用的离散化方法属性构造小波变换数据规约属性规约数值规约小结序言 在数据挖掘中,海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数...

2019-12-25 15:22:02 1226

原创 Python数据分析与挖掘实战学习笔记(2)

Chapter3 数据探索目录Chapter3 数据探索序言数据质量分析缺失值分析异常值分析一致性分析数据特征分析分布分析对比分析统计量分析周期性分析贡献度分析相关性分析总结序言 根据观测、调查收集到初步的样本数据集后,接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?是否出现从未想过的数据状态?其中有没有什么明显的规律和趋势?各因素之间有什么样的关联性? 通过检验数...

2019-12-24 18:09:39 771

原创 Python数据分析与挖掘实战学习笔记(1)

Chapter1 数据挖掘基础目录Chapter1 数据挖掘基础什么是数据挖掘数据挖掘的基本过程定义挖掘目标数据取样数据探索数据预处理模型评价什么是数据挖掘 从数据中淘金,从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是数据挖掘。数据挖掘的基本过程定义挖掘目标 针对...

2019-12-24 13:09:22 560

原创 Python数据分析与挖掘实战学习笔记

Chapter2 Python数据分析工具目录Chapter2 Python数据分析工具序言1. Numpy2.Scipy3.Matplotlib4. Pandas5. StatsModels6. Scikit-Learn7. Keras8. Gensim总结序言 Python本身的数据分析功能不强,需要安装一些第三方扩展库来增强它的能力。 如果安装了Anaconda发行版,那么它自带...

2019-12-14 12:33:05 872

原创 Python爬虫(正则化模块re)

正则表达式序言 让大家久等了,萌萌小编又带来干货给大家了,大家准备双手接住了!这一次,我要介绍python中的re模块,还要隆重介绍正则表达式怎么在爬虫中使用,最后介绍一个爬虫小实战,具体是什么实战,请大家往下翻阅吧。基础部分 世界上的信息非常多,而我们关注的信息有限。假如我们希望只提取关注的数据,此时可以通过一些表达式进行提取,正则表达式就是其中一种进行数据筛选的表达式。当然正则表达式也...

2019-11-02 17:19:53 3098 1

原创 Python网络爬虫基础

基础知识讲解部分(网络爬虫入门)网络爬虫就是自动地从互联网上获取程序。想必你听说过这个词汇,但是又不太了解,大家会觉得掌握网络爬虫还是要花一些功夫的,因此这个门槛让你有点望而却步。我常常觉得计算机和互联网的发明给人类带来了如此大的便利,让人们不用阅读说明书就知道如何上手,但是偏偏编程的道路却又是如此艰辛。因此,我会尽可能做到浅显易懂,希望读者能够读懂我说了什么,从而能够享受到其中的快乐。基本介...

2019-10-30 10:38:31 5278 15

python编程实战-----飞机大战.md

该代码实现飞船大战外星人,而且随着难度的提升,飞船得分不断加大,最高分会显示在游戏屏幕顶部中心,飞船有三条命,该游戏可以帮助小主打法无聊的时光呢,希望大大们能得高分呦!

2020-02-15

python爬虫实战之实时数据挖掘.md

python爬虫实战之实时数据挖掘,通过使用Selenium库实现对新浪财经股票实时数据、东方财富网、裁判文书网、巨潮资讯网的实时数据挖掘。由于这部分内容涉及爬虫进阶知识,所以我把这部分内容归于爬虫专栏,通过对一些网站的信息爬取,掌握了一些爬取方法以及爬虫技巧,还能熟练使用Python语言编写代码,从而有利于人们对这些数据的分析以及利用,从而为社会作出更好的决策。

2020-01-24

python实战之百度新闻爬取.md

通过对百度新闻标题、链接、日期及来源的爬取,了解使用python语言爬取少量数据的基本方法,让网友老爷们得到真正的免费技术,扩充代码方面的知识。

2020-01-17

Python数据分析与挖掘实战学习笔记(3).md

本章主要介绍了数据预处理的4个主要任务:数据清洗、数据集成、数据变换和数据规约。数据清洗主要介绍了对缺失值和异常值的处理,延续了第三章的缺失值和异常值分析的内容,本章主要介绍的处理缺失值的方法分为3类:删除记录、数据插补和不处理,处理异常值的方法有删除含有异常值的记录、不处理、平均值修正和视为缺失值;数据集成是合并多个数据源中的数据,并存放到一个数据存储的过程,对该部分的介绍从实体识别问题和冗余属性两个方面进行;数据变换介绍了如何从不同角度对已有属性进行函数变换;数据规约从属性(纵向)规约和数值(横向)规约两个方面介绍了如何对数据进行规约,使挖掘的性能和效率得到了很大的提高。通过对原始数据的处理,将为后续挖掘建模提供良好的数据基础。

2019-12-24

Python数据分析与挖掘实战学习笔记(2).md

本章从应用的角度出发,从数据质量分析和数据特征分析两个方面对数据进行探索分析。数据质量分析要求我们拿到数据之后先检测是否存在缺失值和异常值;数据特征分析要求我们在数据挖掘建模前,通过频率分布分析、对比分析、帕累托分析、周期性分析、相关性分析等方法,对采集的样本数据的特征规律进行分析,以了解数据的规律和趋势,为数据挖掘的后续环节提供支持。

2019-12-23

Python数据分析与挖掘实战学习笔记(1).md

本章介绍了数据挖掘的一些基础概念知识,便于人们了解这项技术背后的真正含义。

2019-12-23

Python数据分析与挖掘实战学习笔记.md

Python数据分析与挖掘实战学习笔记-------------Chapter2 主要讲解了运用与数据挖掘相关的几个扩展库进行数据分析与数据的挖掘

2019-12-14

Python爬虫(正则化模块re).md

这个是对python爬虫re模块的简单介绍以及对Top250电影数据的爬取实战

2019-11-02

Python网络爬虫.md

python网络爬虫技术之基础讲解部分,着重讲解python的环境搭建以及相关基础知识的讲解。

2019-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除