- 博客(4)
- 收藏
- 关注
原创 构建训练集
1、hive建表真实的生产场景涉及到大概五十张表的字段,这里全部简化流程,直接给出最终的三张表:应用词表:CREATE EXTERNAL TABLE IF NOT EXISTS dim_rcm_hitop_id_list_ds(hitop_id STRING,name STRING,author STRING,sversion STRING,is...
2018-12-29 16:30:27 947
转载 协同过滤中用到的算法
原址https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.htmlGoogle的核心:PAGERANK可以这样解释-------每个页面都是一个投票者和被投票者,pagerank通过迭代得到一个相对稳定的评分。没有复习好 跪在了ALS上协同过滤的核心:1)收集用户的偏好 2)找到相似的用户或者物品3)...
2018-12-25 21:56:16 132
转载 机器学习:余弦相似度和欧式距离的区别(面试问到了)
在机器学习中都可以用来计算相似度。欧氏距离:坐标系中的两个点,用来计算两点之间的绝对距离。余弦相似度:坐标系中的两个向量,计算的是向量的夹角。当时只说出了大概的概念意义,没有进行实例补充。网上找了个例子简单易懂例子:某Tshirt,从100块降到了50块 某西装从1000块降到了500块A(100,50) B(1000,500...
2018-12-25 18:59:38 3092
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人