自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 R语言数据分析入门-陈堰平-专题视频课程

R语言是一种用来进行数据探索、统计分析、作图的解释型语言。它具有丰富的数据类型、灵活多样的作图功能,以及数量众多的算法功能包。目前已在各行各业赢得数据分析者的青睐,并成为众多科研工作者、商业机构、与公司进行数据分析非常重要的一门工具。本课程主要以R语言为基础,共分R语言的介绍及基础语法、读写数据、数据整理入门、数据可视化四个主题,帮助初学者入门数据分析。...

2016-05-13 16:56:52 270

原创 R语言数据分析视频免费大放送

R语言是一种用来进行数据探索、统计分析、作图的解释型语言。本次视频是雪晴数据网6天,6个主题,R语言大牛免费领你入门数据分析直播课程录制的高清视频。目前已将前四次课程的视频剪辑并发布了出来(后两次课程视频获取也在微信公众号发布)。获取方法如下:关注雪晴数据网微信公众号xueqingdata微信公众号后台回复【入门】,获取视频下载链接部分视频高清slide:

2016-04-28 11:55:42 1488

转载 Spark MLlib实现的广告点击预测–Gradient-Boosted Trees

雪晴数据网本文尝试使用Spark提供的机器学习算法 Gradient-Boosted Trees来预测一个用户是否会点击广告。训练和测试数据使用Kaggle Avazu CTR 比赛的样例数据,下载地址:https://www.kaggle.com/c/avazu-ctr-prediction/data数据格式如下:包含24个字段:1-id: ad id

2016-01-25 10:40:59 1261

转载 精通 R plot—第1部分:颜色,图例和线

雪晴数据网本篇文章是关于如何在R中使用plot函数来创建图形系列文章的第一篇。当然,R中还有其他的包可以创建很酷的图形(如ggplot2或lattice)。不过plot函数也可以满足我们基本的绘图要求。在这篇文章,我们可以学习到如何在散点图中添加信息,如何添加图例,最后在图中添加回归线。模拟数据#模拟数据dat<-data.frame(X=runif(100,-2,2),

2016-01-21 10:49:08 13037

转载 十步完全理解SQL

雪晴数据网很多程序员视SQL为洪水猛兽。SQL是一种为数不多的声明性语言,它的运行方式完全不同于我们所熟知的命令行语言、面向对象的程序语言、甚至是函数语言(尽管有些人认为 SQL语言也是一种函数式语言)。我们每天都在写SQL并且应用在开源软件jOOQ中。于是我想把SQL之美介绍给那些仍然对它头疼不已的朋友,所以本文是为了以下读者而特地编写的:1、在工作中会用到SQL但是对它并不

2016-01-20 18:48:28 352

翻译 如何检测异方差并纠正它?

雪晴数据网线性回归一个重要的假设就是残差没有异方差性。简单来说就是残差的方差不会随着响应变量的拟合值而增加。在本篇文章,我会解释为什么检测异方差性是重要的?如何检测模型的异方差性?如果存在,如何通过R代码来纠正这个问题。这个过程有时也被称为残差分析。为什么检测异方差很重要?一旦你建立线性回归模型,通常都要检测残差的异方差性。原因是我们想要检测建立的模型能否解释响应变量Y的一些模式,而它

2016-01-15 13:40:38 40766 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除