自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 构建训练集

1、hive建表真实的生产场景涉及到大概五十张表的字段,这里全部简化流程,直接给出最终的三张表:应用词表:CREATE EXTERNAL TABLE IF NOT EXISTS dim_rcm_hitop_id_list_ds(hitop_id STRING,name STRING,author STRING,sversion STRING,is...

2018-12-29 16:30:27 947

转载 协同过滤中用到的算法

原址https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.htmlGoogle的核心:PAGERANK可以这样解释-------每个页面都是一个投票者和被投票者,pagerank通过迭代得到一个相对稳定的评分。没有复习好 跪在了ALS上协同过滤的核心:1)收集用户的偏好 2)找到相似的用户或者物品3)...

2018-12-25 21:56:16 132

原创 用户画像(面试问到了)数据降维

关于项目推荐系统的内容,问到了用户画像的构造问题没讲清楚数据的归一化:升维的方法:降维的方法:PCA、SVD

2018-12-25 21:19:31 1797

转载 机器学习:余弦相似度和欧式距离的区别(面试问到了)

在机器学习中都可以用来计算相似度。欧氏距离:坐标系中的两个点,用来计算两点之间的绝对距离。余弦相似度:坐标系中的两个向量,计算的是向量的夹角。当时只说出了大概的概念意义,没有进行实例补充。网上找了个例子简单易懂例子:某Tshirt,从100块降到了50块 某西装从1000块降到了500块A(100,50) B(1000,500...

2018-12-25 18:59:38 3092

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除