自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (2)
  • 收藏
  • 关注

原创 执行Docker报错 WARNING: IPv4 forwarding is disabled. Networking will not work.

需要启动一个docker,并执行pip install 命令,总是不成功忽然看到一个警告信息WARNING: IPv4 forwarding is disabled. Networking will not work。网上寻找解决方案:# vim  /usr/lib/sysctl.d/00-system.conf1添加如下代码:net.ipv4.ip_forward=11重启network服务# ...

2018-05-16 08:44:52 211

机器学习实战 pdf + 代码 +数据集

机器学习是人工智能研究领域中的一个极其重要的方向。在现今大数据时代的背景下捕获数据并从中萃取有价值的信息或模式使得这一过去为分析师与数学家所专属的研究领域越来越为人们瞩目。本书通过精心排的实例切入日常工作任务摒弃学术化语言利用高效可复用的Python 代码阐释如何处理统计数据进行数据分析及可视化。读者可从中学到一些核心的机器学习算法并将其运用于某些策略性任务中如分类、预测及推荐等。本书适合机器学习相关研究人员及互联网从业人员学习参考。 目录(共19章) 引言 第1章 机器学习基础 1.2 关键术语 1.3 机器学习的主要任务 1.4 如何选择合适的算法 1.5 开发机器学习应用程序的步骤 1.6 Python语言的优势 1.7 NumPy函数库基础 1.8 本章小结 第2章 k-近邻算法 2.1 k-近邻算法概述 2.2 示例:使用k近邻算法改进约会网站的配对效果 2.3 示例:手写识别系统 2.4 本章小结 第3章 决策树 3.1 决策树的构造 3.2 在Python中使用Matplotlib注解绘制树形图 3.3 测试和存储分类器 3.4 示例:使用决策树预测隐形眼镜类型 3.5 本章小结 第4章 基于概率论的分类方法:朴素贝叶斯 4.1 基于贝叶斯决策理论的分类方法 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类 4.5 使用Python进行文本分类 4.6 示例:使用朴素贝叶斯过滤垃圾邮件 4.7 示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向 4.8 本章小结 第5章 Logistic回归 5.1 基于Logistic回归和Sigmoid函数的分类 5.2 基于最优化方法的最佳回归系数确定 5.3 示例:从疝气病症预测病马的死亡率 5.4 本章小结 第6章 支持向量机 6.1 基于最大间隔分隔数据 6.2 寻找最大间隔 6.3 SMO高效优化算法 6.4 利用完整Platt SMO算法加速优化 6.5 在复杂数据上应用核函数 6.6 示例:手写识别问题回顾 6.7 本章小结 第7章 利用AdaBoost元算法提高分类性能 7.1 基于数据集多重抽样的分类器 7.2 训练算法:基于错误提升分类器的性能 7.3 基于单层决策树构建弱分类器 7.4 完整AdaBoost算法的实现 7.5 测试算法:基于AdaBoost的分类 7.6 示例:在一个难数据集上应用AdaBoost 7.7 非均衡分类问题 7.8 本章小结 第8章 预测数值型数据:回归 8.1 用线性回归找到最佳拟合直线 8.2 局部加权线性回归 8.3 示例:预测鲍鱼的年龄 8.4 缩减系数来“理解”数据 8.5 权衡偏差与方差 8.6 示例:预测乐高玩具套装的价格 8.7 本章小结 第9章 树回归 9.1 复杂数据的局部性建模 9.2 连续和离散型特征的树的构建 9.3 将CART算法用于回归 9.4 树剪枝 9.5 模型树 9.6 示例:树回归与标准回归的比较 9.7 使用Python的Tkinter库创建GUI 9.8 本章小结 第10章 利用K-均值聚类算法对未标注数据分组 10.1 k均值聚类算法 10.2 使用后处理来提高聚类性能 10.3 二分k均值算法 10.4 示例:对地图上的点进行聚类 10.5 本章小结 第11章 使用Apriori算法进行关联分析 11.1 关联分析 11.2 Apriori原理 11.3 使用Apriori算法来发现频繁集 11.4 从频繁项集中挖掘关联规则 11.5 示例:发现国会投票中的模式 11.6 示例:发现毒蘑菇的相似特征 11.7 本章小结 第12章 使用FP-growth算法来高效发现频繁项集 12.1 FP树:用于编码数据集的有效方式 12.2 构建FP树 12.3 从一棵FP树中挖掘频繁项集 12.4 示例:在Twitter源中发现一些共现词 12.5 示例:从新闻网站点击流中挖掘 12.6 本章小结 第13章 利用PCA来简化数据 13.1 降维技术 13.2 PCA 13.3 示例:利用PCA对半导体制造数据降维 13.4 本章小结 第14章 利用SVD简化数据 14.1 SVD的应用 14.2 矩阵分解 14.3 利用Python实现SVD 14.4 基于协同过滤的推荐引擎 14.5 示例:餐馆菜肴推荐引擎 14.6 示例:基于SVD的图像压缩 14.7 本章小结 第15章 大数据与MapReduce 15.1 MapReduce:分布式计算的框架 15.2 Hadoop流 15.3 在Amazon网络服务上运行Hadoop程序 15.4 MapReduce上的机器学习 15.5 在Python中使用mrjob来自动化MapReduce 15.6 示例:分布式SVM的Pegasos算法 15.7 你真的需要MapReduce吗? 15.8 本章小结 附录A Python入门 A.1 Python安装 A.2 Python入门 A.3 NumPy快速入门 A.4 Beautiful Soup包 A.5 Mrjob A.6 Vote Smart A.7 Python-Twitter

2018-04-17

Python数据分析与挖掘实战 pdf + 源代码 +数据集

Python数据分析与挖掘实战,压缩包里面包含文档pdf与文档配套的代码 10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。, 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。, 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。, 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再 阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除