自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

之东的博客

读书看世界

  • 博客(4)
  • 收藏
  • 关注

原创 特征相关内容总结

特征编码示例原始值实数 (0.23432)离散 (1 | 2 | 3 …)多个值 (1,3,4)channel: one-hottag: 电影、国内、动作编码方式所有编码方式都可转化为以下三类:单值 ( 离散:0,1 ; 稠密:float(归一化) )怎么归一化?one-hot,分桶方式?向量 (embedding)归一化?hash 稀疏特征 ( tag,id… )怎么hash?怎么处理多值?特征示例数据示例编码方式

2020-10-08 16:58:05 310

原创 常用数据格式

libsvm1 1:1 214:1 233:1 234:1dummy1 1 214 233 234csv(csv格式为每个数据由逗号“,”分隔)0.29,0.31,32.8,92.5,22,20,0.7750820447097237,0.5326322957198866 0.61,0.76,7.8,84.4,42,40,0.6650599517190358,0.47773242152197465 0.21,0.23,19.8,84.8,31,30,0.6798212287221709,0.67

2020-10-08 16:53:53 730

原创 LR

LR原理以及公式推导 为什么logistic回归的要用sigmoid函数?优缺点? Linear SVM与LR的异同 LR的损失函数的公式和函数 LR如何解决共线性,为什么深度学习不强调 LR如何防止过拟合 LR分布式训练怎么做...

2019-04-07 19:38:50 279

原创 算法工程师面试准备

分类回归模型LR GBDT 原理以及公式推导 ID3和C4.5的优缺点,树的融合 GBDT的参数怎么调 boost算法的思路是什么样的?讲一下你对adaboost 和 gbdt的了解? 决策树处理连续值的方法 优缺点,适用场景以及如何选型 ID3,C4.5,CART等,决策树的split原理和剪枝策略 ID3和C4.5的优缺点,树的融合 RF(随机森林) ...

2019-03-17 22:22:39 377

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除