自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

慕小白的博客

菜鸡成长路

  • 博客(4)
  • 收藏
  • 关注

原创 |机器学习| - R语言 - 随机森林 - 分类、回归、预测、筛选变量有史以来超详细解析(干货满满)

R语言随机森林详细解析(基于randomforest包和varSelRF包)随机森林 基于R你即将从这里看到你不会看到研究如何用R去实现随机森林也有三个月的时间了,从一开始的完全不理解,到现在的游刃有余,我似乎花了过多的时间,毕竟是初学者嘛。不知各位有没有发现,CSDN上随机森林的教程都说的有些模糊,好像在刻意回避着什么,而且很少有人说变量筛选的问题。所以,今日,我觉得有必要记录一下了。随机森...

2019-08-03 21:51:38 75321 118

原创 大数据入门——搜索广告的文本点击率预估(python实现)2019高校大数据挑战赛

大数据入门——搜索广告的文本点击率预估(python实现)文本点击率预估概念解释思路分析具体步骤一、工具、原料(gensim包的配置、导入)二、基于词频逆文档矩阵的相似度三、基于集合运算的相似度(jaccard、tanimoto)三、基于词向量的相似度四、合并训练总结这是我的第三篇博文。数据来源于某高校大数据比赛,可以去官网自行下载。由于比赛时间与期末考试冲突的原因,线下模型已经搭建,但是线上数...

2019-07-08 16:02:10 1653

原创 大数据入门——文本情感分类(python实现)2019高校大数据挑战赛

大数据入门——文本情感分类(python实现)文本情感分类总思路详细步骤一、导入数据二、分词三、数据清洗四、构造特征五、分割训练集、测试集六、训练数据svm支持向量机KNN逻辑回归贝叶斯随机森林七、预测数据八、评价模型总结菜鸟小白的第二篇小博文我就拿某高校比赛的数据当例子吧。。这是比赛方提供的训练数据,分为三列,分别是ID、文本、label。文本部分据传说是印尼语的拼音,所以并没有现成的词...

2019-06-19 09:30:52 3506 5

原创 慕小白聊R与Python

浅谈Python与R概述对于社会科学对于数据科学对于计算机科学对于绘图需求菜鸟小白的第一篇小博文概述关于R和Py到底应该学哪一个,这个问题经常被刚入手统计or数据科学的同学们热切讨论。其实,很多大佬已经对R与Py做了很深刻的对比,不比他们,我单从一个初学者的角度,谈谈R和Py。对于社会科学本人公共管理专业出身,属于社会科学类(管理学),在代码的世界摸爬滚打全靠自己,练就了一身自学的本领,...

2019-06-17 21:45:17 544

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除