自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【金融风控-贷款违约预测】Task5 模型融合篇

阿里云天池学习赛 – Datawhale学习笔记文章目录1、 模型融合的方式2、 stacking\blending2.1 stacking\blending详解2.2 Blending与stacking的不同3、代码示例3.1 平均:3.2 投票4、Stacking:5、blending6、经验总结衔接笔记内容链接赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约预测项目地址:https://github.com/datawhalechina/team-learn

2020-09-27 18:30:42 335

原创 【金融风控-贷款违约预测】Task4 建模与调参篇

阿里云天池学习赛 – Datawhale学习笔记文章目录一、学习内容二、代码三、关于调参四、经验总结衔接笔记内容链接赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约预测项目地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl比赛地址:https://tianchi.aliyun.com/competition/entra

2020-09-24 22:43:18 377

原创 【金融风控-贷款违约预测】Task3 特征工程篇

阿里云天池学习赛 – Datawhale学习笔记文章目录1、学习目标2、内容介绍3、特征预处理3.1 关于异常值的补充3.1.1异常值处理:3.1.2 检测异常的方法一:**均方差**3.1.3 检测异常的方法二:**箱型图**3.2 数据分桶3.2.1 分箱方法:3.3 特征交互3.4 特征编码4、特征工程5、总结1、学习目标Task3 特征工程篇教程链接 :点我学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法学习特征交互、编码、选择的相应方法2、内容介绍3、特征预处

2020-09-18 23:35:34 525

原创 【金融风控-贷款违约预测】Task2 数据分析篇

阿里云天池学习赛 – Datawhale学习笔记文章目录1、学习目标2、EDA方法&基本流程3、常规EDA操作【主要操作与思路】3.1、缺失率分析与缺失值处理方法3.2、数据分布探索3.3、连续变量与离散变量的分布与相关性分析3.4 一键EDA报告:便捷工具pandas_profiling4、重点总结1、学习目标task1链接:数据背景介绍教程学习链接:Task2 数据分析目的:了解数据,熟悉数据,为后续的特征工程做准备EDA价值:1.主要在于熟悉了解整个数据集的基本情况(缺

2020-09-18 23:02:28 436

原创 【金融风控-贷款违约预测】task1 赛题理解篇

阿里云天池学习赛【金融风控-贷款违约预测】Datawhale学习笔记

2020-09-13 20:13:43 470

原创 特征选择

F-measure:2recallprecision / ( recall + precision )ROC曲线:FPR为横坐标,TPR为纵坐标PR曲线:recall为横坐标,precision 为纵坐标

2019-01-07 15:54:24 1354

原创 Python笔记

Python还是要踏踏实实搞起来的显示所有行或列import pandas as pd #显示所有列pd.set_option('display.max_columns', None)#显示所有行pd.set_options('display.max_rows', None)#设置value的显示长度为100,默认为50 pd.set_option('max_colwidth',1...

2019-01-06 23:54:53 387

原创 SQL笔记

order_new 数据量1382233//=0 而非 >0的原因:会过滤掉当前这笔订单– ------------------------- 按月统计样本量– select substring(transtime,1,7) transtime,– count() total_num,– sum(case when label = 1 then 1 else 0 end )bla...

2018-12-28 11:30:38 202

原创 小花培训笔记

同一个ip过去的登录次数re=login_table.groupby(['ip'])['event_id'].apply(lambda x:len(np.unique(x))).reset_index()re1=login_table[['cid','ip']].drop_duplicates()ip_login_count_data=pd.merge(re1,re,on=['ip'],ho...

2018-12-17 17:55:09 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除