自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (2)
  • 收藏
  • 关注

原创 数据科学总纲:欲练此功,必过此纲

大家好,我是ZZ,目前在网易担任数据分析师。欢迎大家来到我的个人专栏。 知之为知之,不知为不知,是知乎。虽然知乎目前水化现象严重,但仍然是知识分享最好的平台。 创建这个专栏主要有三个目的: 一是将自己多年来对数据科学知识的一点理解进行总结,并且以通俗易懂的语言呈现给读者,以便大家学习。 二是结合自身工作经历,对未来想从事数据科学工作的同学提供一个成本最小的路径,以便大家及时的找准方向并为之努力。 三是希望通过这个专栏,吸引更多的同道中人,或者说,寻找到和我一样有趣的灵魂。 这篇文章的主要目的就是

2020-12-05 17:14:56 129 1

原创 监督学习(2)|本质是分类的“逻辑回归”

1. 引言 机器学习,绕不开预测问题,预测绕不开回归和分类。本篇介绍最常用的二分类算法:逻辑回归(Logistics Regression),当然随着算法的发展,它也可用于多分类问题。每一个算法都是许许多多数学家的努力铸就,理论篇希望自己可以尽量将算法发展过程叙述的平滑一些,可以即保留理论基础,又让读者感觉舒服。下面,就让我们一起来领教一下这处理问题的伟大逻辑。 2. 回归到分类的过渡 逻辑回归,顾名思义,分为两部分:逻辑和回归。 首先让我们回忆一下上一篇线性回归的内容。 我们希望透过样本得到数据背后的本质

2020-12-09 20:34:04 110

原创 监督学习(1)|一文搞懂线性回归,lasso回归,岭回归

1.引言 机器学习三大主要分支:监督学习、无监督学习和半监督学习。 对于监督学习,根据目标数据类型的不同分为二大核心任务:分类和回归。 其中分类指目标数据为离散型变量,回归指目标数据为连续型变量。 对于回归分析方法,本文主要介绍在实际应用最广泛的线性回归分析。之后也会分享对应的实践案例(Python和R)。 2. 简洁的本质 借用“科普中国”科学百科词条中的定义: 回归分析是确定两种或两种以上变量关系的一种统计分析方法。 所谓透过现象看本质,我们希望对观察到的现象,经过统计分析,可以洞悉现象背后客观存在

2020-12-06 13:03:21 423

按关键字批量采集百度搜索结果

创建关键字文档,按行爬取文档中关键字的百度搜索结果。

2018-05-13

爬取网页正文

通过HTTP地址,可自动过滤广告等无用信息,自动爬取网页正文部分。

2018-05-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除