自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(完:观看决赛答辩感想)

早一段时间看了决赛的答辩直播,作为一只萌新,决赛中提到的一些trick其实许多都有用到,但是没能够整合起来形成系统的框架,东拼西凑,自己都不知道一些trick的效果如何也加了进去,所以效率还是低了一些。决赛是用前7天的数据预测第8天下午的购买量。比之初赛的难度加大。拜拉席恩队1.Binning之前一直不知道在第一部分里的分段函数的专业名词叫啥,原来是叫做binning,分箱的意思,为了避免过拟合。...

2018-06-23 11:40:29 1599 1

原创 天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(三:lightgbm调参、ensemble)

lightgbm参数解释boosting = ‘gbdt‘,迭代器选’rf’效果略优is_unbalance=True,实际数据的样本是不均衡的,但是设置该参数导致迭代效果变差       bagging_fraction=0.7,       bagging_freq =1,使用了bagging方法,随机选择了70%的数据进行训练,每1步迭代做一次bagging效果无明显提高,但是理应有所提高。...

2018-04-22 17:57:52 7178 2

原创 天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(一:数据预处理、特征工程)

第一次正式参加数据挖掘类的比赛,投入了三个星期。结果没有进入复赛,但是学到了许多经验。感谢技术圈和github的大佬们提供的baseline,让我少走了很多弯路。第一次写博客,其一为了防止以后忘记,其二如果萌新能帮到萌新新们也是很开心啦。思路:全文按照数据预处理、特征工程和模型融合讲解,并附有代码。数据预处理1 导入库和读取数据1.1导入库:import pandas a...

2018-04-22 14:06:59 4035 10

原创 天池- IJCAI-18 阿里妈妈搜索广告转化预测(完整版代码,数据集等总结)

转眼间已经毕业,再过一段时间就要踏上工作的岗位了。发现有许多朋友问数据集,以及我的代码运行不出来的问题,果然我当时写博客太散漫了- - !本来想着把以前写的都重新修改一遍,但是我不是很喜欢CSDN的会员积分下载制度(曾经充的会员一年到头都没有用过几次),以后还是简书为主好了。所以我整理了比赛时写的三篇博文的程序,按照行文逻辑注释了一遍,希望对大家有所帮助。一、特征工程、stacki...

2019-06-30 08:25:14 2718 1

原创 实习-winSCP /Xshell /idea /scala /spark 安装包及新环境搭建

1、winSCP和Xshell刚进公司会分配给一个端口和账号,首先使用Xshell登录hadoop集群,把集群里面的数据下载到自己账户里面。然后再用winSCP把集群账号上的数据下载到本地这两个东西可以独立安装,也可以更改安装路径。安装包源链接网址:winSCP:   官网链接(需要用IE浏览器打开)Xshell: 6.0破解版(CSDN)安装包百度云地址:参考博客:点击打开链接2、java环境配...

2018-07-08 10:21:26 582 1

原创 win10完整安装xgboost流程和截图,解决报错(dmlc-core、python setup.py install)(外加pip下载链接)

前面部分是2017年第一次安装的时候报错的一些提示和安装的注意事项,今年又重新装了一次,都截图了,所以具体安装流程在后面。2017年第一次安装作为一个小白,这是目前最难安装的库了。详细的安装过程参考了这篇博客:http://blog.csdn.net/xxzhangx/article/details/54908500还有关于报错的帖子:https://github.com/dmlc/xgboost...

2018-06-26 10:21:06 907

原创 用tensorflow深度学习梵高的画并模仿

最近在知乎上发现的一个好玩的东西:杨航锋的回答动手把它实现了一下,记录下自己遇到的问题防止遗忘。1、tensorflow需要python3这一点曾经深深影响了我学习这个教程的动力。不过好在anaconda可以新建一个环境使得python2和python3兼容。所以到网上查看搭建python2和python3环境的攻略就好了,记得设置python3为环境变量。2、按照教程完成基本工作1.相关依赖库的...

2018-06-09 11:11:00 5526 8

原创 时间序列分析-python(一、自相关系数的意义)

最近在学习时间序列预测销量,做一些笔记。参考:自相关系数根据自相关图判断AR/MA/ARMA模型平稳时间序列时间序列必须是平稳的才可以做后续分析,差分和log都是为了使时间序列平稳。一个时间序列,如果均值和方差没有系统变化或周期性变化(均值无变化:没有明显趋势,方差无变化:波动比较稳定),就称之为平稳的。自相关系数平稳序列的自相关系数会快速收敛,从哪一阶开始快速收敛(忽然从一个较大的值降到0附近)...

2018-04-30 13:36:04 71090 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除