自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

知青的博客

一个初级数据猿

  • 博客(2)
  • 收藏
  • 关注

原创 python、R对比分析

一、Python与R功能对比分析1、python与R相比速度要快。python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。Python=R+SQL/Hive2、如果是统计理论研究、前沿科学研究,R比python更胜一筹。R的优势在于有包罗万象的统计函数可以调用,特别是在时间序...

2018-04-10 16:59:06 11766 1

转载 随机森林

1.随机森林算法学习综述 2.集成学习 2.1 Bagging(套袋法)算法 2.2 Boosting(提升法)算法 3.决策树算法 4.随机森林算法随机森林算法学习综述 最近在做kaggle的时候,发现随机森林这个算法在分类问题上效果十分的好,大多数情况下效果远要比svm(支持向量机),logistic回归(广义线性回归),knn(K邻近算法)等算法效果好。因此想琢磨琢磨这个算法...

2018-04-09 17:48:25 349

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除