自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 自动调参工具--贝叶斯调参

一般的方法就是网格搜索(sklearn里面的gridsearch)、贝叶斯调参(hyperopt工具)。http://www.360doc.com/content/18/0707/15/7669533_768542933.shtml

2019-10-10 10:41:00 409

原创 Stacking结构介绍+代码实现

stacking是这两年打数据比赛被人熟知的方法,看了几篇,感觉有几个写的不错。1.介绍篇:https://blog.csdn.net/wstcjf/article/details/779899632.代码篇:https://blog.csdn.net/WxyangID/article/details/80205075https://blog.csdn.net/shine199...

2019-10-09 11:11:09 2372

转载 Mac 安装SecureCRT

网上搜了这么多,还是这个同学的方法详细可行https://blog.csdn.net/hc_mm/article/details/82657037

2019-07-12 18:32:12 972

原创 Mac 安装lightgbm指南

版本:10.13.6先是按照官方指南做,然后有3个坑注意: (1)brew install gcc --without-multilib 这一步,显示without-multilib是无效命令,我就直接brew install gcc。然后最后几步,(2)export CXX=g++-7 CC=gcc-7这里是个坑,需要适配我们自己的gcc版本。查看自己的版本:通过c...

2019-07-09 16:16:19 2400

转载 有监督算法

1.逻辑回归

2019-05-08 15:36:50 1627

原创 无监督算法汇总

1.EM 算法原理解释+ 例子分析+应用(GMM讲解1+GMM讲解2)2.孤立森林博客

2019-05-06 16:21:57 3974

原创 PU learning 算法

一.背景介绍原本是02年提出的一个算法,但是到去年8月份,关于PU learning 的博客介绍都很少(可参考性很差),前几天做毕设,忽然欣喜地发现这半年里陆续出现了几篇关于该算法的文章,挺不错,和大家分享一下。1.去年我只找到了一篇ACM期刊的论文解析,有个博客介绍得很不错,文章思路通俗易懂,是很好的入门样例https://www.cnblogs.com/DjangoBlog/p/9...

2019-05-04 17:31:09 3409

转载 上传本地代码到git hub

先参考文章1,然后执行到第五步的时候,需要在把本地密钥加到github上,参考文章2,直接按第二条开始做就好,最后再把文章1的第六七步做完就好。一些常用指令:git add --all 添加所有更新git commit -m "we did it"//提交修改说明git status//查看状态git push origin master//上传修改git pull ori...

2019-03-08 22:11:27 335

原创 神经网络的诸多问题

1.激活函数简介2.为什么sigmoid容易出现梯度消失

2019-02-24 16:59:12 532 1

原创 概率论的一些讨论

1.假设检验1)显著性水平αa.小概率事件:我们将发生概率小于某个阈值的事件称为小概率事件,一般让这个阈值=0.05(或者0.01),在假设检验中常记这个阈值为α,称为显著性水平。如果某件事的概率超过这个值,我们认为它不是小概率事件,我们便不能做这件事。放到假设检验中就是,如果最后计算的统计量P>阈值(即显著性水平),那么“我们接受H0,会犯错误”这个事就不是小概率了,也就是我们接受...

2018-08-28 15:57:46 830

原创 IJCAI-2018--广告销量预测 19/5200 思路

这次比赛的最大感受就是:别掉以轻心,初赛和复赛开始我们成绩一直在前边,导致心态太翘,该尝试的探索的其他模型没有去做,光在特征上按照初赛思路去做,没有绝杀技,导致有后手的把我们ko了。惨痛教训。。。------------------------------------------------------------------------------------------------------...

2018-05-24 10:10:58 567

原创 推荐一个很全面的python安装包下载的网址

https://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow

2018-05-22 15:45:05 2830

原创 研究生初学机器学习的几点建议

      通过我自己的这大半年的接触和了解,结合找工作需要现对于如何入门机器学习提几点自己的看法。如果你以后要想干算法工程师、机器学习工程师,数据挖掘工程师。那么请你好好看一下我下面说的话。============================================================================总路线      先学机器学习,再学深度...

2018-05-18 17:51:41 9050 5

原创 Numpy,List,Dic,Dataframe 和Series

np是数组,list是列表。ny是可以查看数组shape的。而list没有shape标签list转化成np:a=np.array([1,2,3,4,5])字典要想幻化成list,需要先将自己转化成np.array,再用tolist函数变成列表。实例比较:def max()//求取集合中最大值下标那么哪些可以作为输入的集合呢?np.array([[2],[4],[3],[1],[9]])  可以  ...

2018-05-18 17:24:32 373

原创 深度学习--神经网络基础篇

转自我的简书1转自我的简书2

2018-05-18 17:23:27 2289

原创 深度学习--资料篇

实验室学长给的意见是先学习机器学习,再学习深度学习。资料列表:1.西瓜书《机器学习》(周志华著)+AI圣经《Deep learning》/《深度学习》(英/中文版都有,根据自己情况来,中文版也不错)(作者是Ian Goodfellow,Yoshua Benjio等人)2.tensorflow的学习可以买本书参考,也可以直接去英文官网看教程,不懂去看官网,也可以看视频。熟练了以后参加几个比赛CCF的...

2018-05-18 17:21:34 251

原创 廖雪峰Python3教程---实战day1-day13总结

转自我的简书

2018-05-18 17:20:16 1198

原创 python 爬虫笔记

转自我的简书

2018-05-16 16:32:13 119

转载 机器学习--模型比较篇

1.bagging & boosting1)样本选择上:Bagging:训练集是在原始集中有放回选取的,从原始集中选出的各轮训练集之间是独立的。Boosting:每一轮的训练集不变,只是训练集中每个样例在分类器中的权重发生变化。而权值是根据上一轮的分类结果进行调整。2)样例权重:Bagging:使用均匀取样,每个样例的权重相等Boosting:根据错误率不断调整样例的权值,错误率越大则权重...

2018-05-16 16:31:01 529

原创 机器学习--LGB模型学习

转自我的简书

2018-05-16 16:23:12 37257 1

转载 机器学习--基础模型篇

1、线性模型http://www.cnblogs.com/pinard/p/6026343.htmlhttp://blog.csdn.net/u012102306/article/details/52988660http://blog.csdn.net/gamer_gyt/article/details/512327332、LogisticRegressionhttp://www.jianshu....

2018-05-16 16:21:13 176

转载 Python的一些特性

1.生成器(generator)1.1 yield理解:http://www.jianshu.com/p/d09778f4e0552.深浅拷贝a.转自我的简书b. https://blog.csdn.net/a657997301/article/details/79776097

2018-05-16 16:20:04 107

转载 数据结构基础知识

1树的遍历:三序:http://m.blog.csdn.net/soundwave_/article/details/53120766知二序,推二叉树(必须知道中序)https://www.cnblogs.com/xinchrome/p/4905608.html

2018-05-16 16:18:32 106

原创 【阿里天池--乘用车销量预测 16名经验分享---浅谈划窗slid window】

原文在我的简书

2018-05-16 16:17:14 1500 6

原创 ubantu 16.40 远程连接SSH相关操作

转自我自己的简书:主要处理突发的ssh连接不上服务器的问题

2018-05-16 16:15:25 166

转载 有限内存读取超大数据

1.1https://www.kaggle.com/c/talkingdata-adtracking-fraud-detection/discussion/561051.2https://blog.csdn.net/xingkong_dahai/article/details/77140918分块读取完后,对int,float和object进行修改类型,可以节省很多内存,然后再保存成pickle文...

2018-05-16 16:13:09 1001

原创 #纪念一下

开篇#从简书转战到CSDN啦

2018-05-16 16:09:49 135

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除