自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据挖掘学习笔记

复现的一些代码、看到的有用的知识以及自己的感悟

  • 博客(7)
  • 收藏
  • 关注

原创 WARNING: src/objective/regression_obj.cu:152: reg:linear is now deprecated in favor of reg:squarede

借鉴博客:https://blog.csdn.net/zuoyouzouzou/article/details/103046281源代码在此: model = xgb.XGBRegressor(n_estimators=150, learning_rate=0.1, gamma=0, subsample=0.8,\ colsample_bytree=0.9, max_depth...

2020-04-08 11:17:12 3045 3

原创 正则化项作用、位置及思想原理

之前一直搞不太懂正则化项是什么东西,最近在看XGBOOST原理及李航的《统计学习方法》,根据《统计学习方法》中所说,目前大概有一个理解,先贴在下面。思想原理:正则化项简单来说是我们为了控制学习器(模型)的复杂度加入的一个惩罚项。这个惩罚项加在目标函数里面。比如我们的目标是目标函数最小化,那么我们如果模型很复杂,那么正则化项就会很大,从而来说达到我们最小化的目的就会很困难。所以要达到最小化的...

2020-04-05 13:48:02 4273

转载 天池二手车交易价格预测-task[5]-模型融合

集成模型往往在数据比赛中会有比较好的成绩主要包括以下三种方法:投票集成平均排名平均1.简单加权平均def Weighted_method(test_pre1,test_pre2,test_pre3,w=[1/3,1/3,1/3]): Weighted_result = w[0]*pd.Series(test_pre1)+w[1]*pd.Series(test_pre2)+w...

2020-04-04 17:09:12 326

原创 [数据挖掘]天池二手车交易价格预测-建模调参-DataWhale学习笔记(待补全)

一直都想快点能够进入模型预测部分,但是不知道是自己太磨叽还是怎样,看几个算法原理看到自闭,但是还是觉得需要了解清楚模型的原理才能够对症下药解决问题。时间有限,在这里并没有进入代码实践步骤,而是先搞清楚了LR,GBDT,XGBOOST几个算法大概的原理。先贴一下,等回血了再来改。0.一些概念预测交易价格是个名副其实的监督回归任务,其实对于回归任务风靡数据圈的大杀器应该是XGBOOST,但是我还是...

2020-04-01 19:36:56 794

原创 [数据挖掘]天池二手车交易价格预测-特征工程-datawhale学习笔记

特征工程是用一些手段,整合现有数据的特征变成对数据能够进行更好表达的特征,以便给模型输入的时候能够用数据集的特征对数据进行更好的表达。所以特征工程这一步尤为重要,是决定最终预测精确性的关键。常用的方法:1.数据清洗:处理掉数据中异常值、缺失值,以便数据变得规整。2.特征构造:把现有数据进行整合(一些变换),组合成与目标属性相关性更强的特征。3.特征筛选:筛选出输入的特征中对结果有意义的特征...

2020-03-28 14:03:19 689

原创 [数据挖掘]天池二手车交易价格新手赛预测-EDA Datawhale学习笔记

新手赛地址在此:https://tianchi.aliyun.com/competition/entrance/231784/information首先感谢datawhale提供了这样好的机会,能够督促激励和引导数据挖掘新手从0开始自己的数据挖掘之路。赛题背景数据包:一个500条数据的test集和1500条数据的训练集属性:如上这里的EDA主要参照AI蜗牛车大神的代码,完善了一下自己对...

2020-03-24 19:47:50 346

原创 瓜书学习笔记-多分类学习啰嗦版

对瓜书63页个人消化理解作为一个小白,最近在课业压力下坚持不懈的看着瓜书。总是会觉得看视频的效果好于自己啃书,然鹅。。瓜书有视频版么??(一想到以后要持续不断地翻看英文论文和书籍心情就#%+||?*?……@?)Anyway,言归正传。在自己啃书的时候会遇到很多问题(比如想发一篇博客都得花20min速成一下Markdown编辑器),在前三章过程中最难啃的莫过于这个多分类学习(瓜书63页)。第一遍...

2018-10-19 15:53:50 427

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除