自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

木琦

机器学习实战

  • 博客(6)
  • 问答 (2)
  • 收藏
  • 关注

原创 《助理来也》NLP公司电话面试

《助理来也》NLP公司电话面试第一次面试,感觉这个公司很靠谱,因为中午有事,HR说五点然后改到6点,面试官6点整给我打电话,瞬间就感觉对这个公司好评满满。可能因为是初创公司,面的基本内容可能和公司需要的人才需要对口。没有问什么高大上的算法。对面试官和公司评价都不错,但是我基础部分面的不好,可能跪了。目前面完4天了没消息。-面试的主要部分如下1:CNN、RNN基本概念和网络结构。当时RNN不太熟,面的

2017-03-14 14:51:39 2390

原创 sklearn.GBDT 源码阅读(细节掌握)

依然是接着上一节的,我们关注每颗树是如何建立的。n_stages = self._fit_stages(X, y, y_pred, sample_weight, random_state, begin_at_stage, monitor, X_idx_sorted) def _fit_stages(self, X, y, y_p

2017-01-12 02:09:07 2637

原创 sklearn.GBDT 源码解读(宏观把握)

sklearn.GBDT源码解读 最近一直玩数据挖掘,GBDT使用了一点,就想看看源码是怎么实现的。 x当训练一个GBDT模型的时候,gbdt=sklearn.ensemble.GradientBoostingClassifier(param)本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮

2017-01-09 20:53:21 5223

原创 LIBSVM的结构分析

Svm_group_classes,该函数实现的目的是把数据集依照类别进行划分。Nr_class就是类别的个数,比如手写识别案例就是nr_class=10,因为十个数字。分好类以后采用one-to-one的训练方式。两个for循环遍历nr_class,每一类都和其他所有类进行一次最优超平面的划分。最后综合投票决定划分。

2016-03-20 21:40:44 978

原创 机器学习实战 决策树 算法 笔记

卧槽 尼玛发现个史诗巨鳄 _name_ 如果加上_name_ 会报错 str object has no attribute ‘_name_‘ 我在Python27下亲自试过 不加_name_ type(secondDict[key]) 直接输出的就是type'dict' 或者是 type'str' 但是最重要事情来了。。。'dict' 和dict的区别 ==右侧如果是'dict' 直接字典就不是字典了。。而改成dict 不加单引号 就正确了 加上单引号直接就是叶子节点2 深度是1 但是如果不加单引号就

2015-11-07 19:05:00 3562

原创 机器学习实战--KNN 算法 笔记

print "the total error rate is: %f"%(errorCount/float(numTestVecs)) /* 错误率 /*最后得出结果 5%的错误率 机器学习实战书上算的2.4% /* 在不改变其他值的前提下 改变hoRatio的值 [0.05,0.1,0.2,0.3,0.4,0.5,0.9]对应的错误率[2%,5%,8%,8%,7%,6%,7%] 9:在测试结束,我们力求得出一个对于未来的约会预测函数,在我们输入飞行里程数,玩视频游戏的百分比和冰激凌公升数,我们希望

2015-11-07 18:59:20 3478

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除