自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (10)
  • 问答 (1)
  • 收藏
  • 关注

原创 深入浅出推荐系统(九):排序:古法良方--线性模型与树模型

LR与LR+GBDT在排序模型中的应用

2023-10-20 18:27:29 89 1

原创 深入浅出推荐系统(八):排序:目标引领方向

如果非要在推荐系统里找出机器学习最能大展拳脚的领域,那一定是排序部分。只有模型化的排序,才可能为广告系统和排序系统带来大的收益。由于排序模型在推荐和广告领域有着举足轻重的地位。本章里,我们不谈具体排序方法,先从整体对排序模型进行概要了解。

2023-03-21 18:20:35 370

原创 深入浅出推荐系统(七):水源木本--特征工程

特征工程是技术中的艺术,如果把机器学习比作做饭,原始数据就好像原始食材,没法直接放锅里去煮,特征工程就是备菜的过程。清洗、加工、切菜、腌制等操作决定了做出的菜是否美味。而这个加工的过程,是切段还是切丝,是盐卤还是酱腌,就看厨师心中之丘壑了。

2022-09-02 17:17:14 459

原创 深入浅出推荐系统(六):召回:一切为了业务

仅从召回系统来说,召回池中必然会存在人工策略的部分,用于获得优质的用户体验,以及商业目标的实现。如果把模型召回比喻成经济学中的市场机制,通过自由竞争来高效地完成资源交换,人工策略则属于宏观调控机制,通过人工调节,来引导市场向着健康成熟方向发展。...

2022-07-14 16:54:15 1083

原创 深入浅出推荐系统(五):召回:人人都爱的热门

无论个性化多么重要,热门推荐都是推荐系统里不可或缺的一部分。本文详尽介绍了热门推荐的各种算法,技巧以及热门榜单的攻防之道。

2022-06-21 18:13:45 512

原创 深入浅出推荐系统(四):召回:向量化的潮流

只要对机器学习稍有涉猎,就会发现如今机器学习,无论是推荐、图像、语言等领域,随处可见embedding,可以说,在深度学习主宰机器学习领域的今天,万物皆可embedding。那么,什么是embedding,怎么对实体进行embedding,推荐领域里,embedding会怎么应用呢?且待本文一一道来。

2022-06-01 20:39:43 1057

原创 深入浅出推荐系统(三):召回:协同过滤--永恒的经典

亚马逊作为商业化推荐系统的祖师,推出的开山之作便是协同过滤(collaborative filtering)。即使到了以深度学习为主流召回算法的今天,协同过滤仍然是推荐系统召回策略中绕不开的经典算法。它的思路简洁易懂,效果却出奇地好。今天,我们便来深入聊聊协同过滤算法。什么是协同过滤所谓“协同”,是指用户之间或物品之间的相似性,“过滤”则是指根据相似性,从大量物品中进行筛选的过程。这里说的相似性,并不等同于我们上一章中所讲的内容在语义上的相似。这里的“相似”,是与用户行为相关的,通常是指用户对物品的行为

2022-05-18 17:15:31 803

原创 深入浅出推荐系统(二):召回:内容为王

大家在访问京东或者淘宝等电商系统时,会发现当看了某件商品或者买了某件商品时,电商系统会马上推荐很多相似的商品;当在百度上搜索某个新闻时,信息流马上推荐类似的新闻,这些是怎么做到的呢?这就涉及到我们今天要讲解的基于内容的召回。为什么需要基于内容的召回无论是协同过滤,还是深度学习模型,当下最流行的推荐系统几乎都是以用户与物品交互行为为核心,来构建其召回体系的,但无论何时,基于内容的推荐仍然能够保留其一席之地,这是因为:其一、对于处于发展启动期的推荐系统来说,用户的内容交互量相对较少,需要有以内容召回为核心的

2022-04-28 10:58:58 1168

原创 深入浅出推荐系统(一):推荐系统基本架构

深入浅出推荐系统(一):推荐系统基本架构提纲过去八九年在广告、生活服务、电商等领域从事大数据及推荐系统相关工作,近来打算对过去的工作做一个系统性的梳理。一方面帮自己查缺补漏、进行更深入的学习;另一方面也希望能通过博客结交同好,增进交流。这一博客系列以介绍推荐系统为主,会少量涉及广告系统。本篇文章作为该系列的第一篇,主要对推荐系统、数据框架等进行整体介绍,不涉及过多技术细节问题。推荐系统简史在互联网信息爆炸的今天,推荐系统是我们身边一个无法躲避存在。在淘宝上浏览商品,在抖音上刷视频,以及无处不在的小

2022-04-19 14:55:52 11432 1

原创 【二】TensorFlow的变量管理

庞大的神经网络构建及训练过程中,需要对变量进行多次索引,tf框架本身设计了比较完善的变量管理机制。变量作用域能够更好的管理模块的变量(特别是将来会重用到的变量)。tf常用的变量作用域有两种:tf.name_scope和tf.variable_scope,tf本身的变量管理有如下接口:tf.get_variables 和 tf.Variabletf.name_scope主要与tf.Varia...

2020-03-26 13:00:52 115

原创 【三】TF接口-embedding_lookup

embedding_lookup是什么?tf.nn.embedding_lookup函数的用法主要是选取一个张量里面索引对应的元素。embedding就是将输入文本表达成向量形式。向量化后需要用索引来查询对应向量,embedding_lookup就是帮助开发者来完成索引向量查询的。为什么用embedding_lookup?tf框架里,它会为输入的张量自动建立one-hot索引,但建立好的索引...

2020-03-19 10:15:46 516

原创 强化学习(一):强化学习浅谈

最近接触强化学习,发现非常有意思,强化学习多是一种动态规划的思路,使用生活化语言描述,就叫做:实践出真知。相较于有监督和无监督的学习,强化学习更多地是在决策产生结果的反馈基础上进行不断的优化。(在决策结果反馈前,有监督和无监督学习已经固定了决策方案)。强化学习的使用场景(摘自:深度学习500问-强化学习):(1)Manufacturing例如一家日本公司 Fanuc,工厂机器人在拿起一个物...

2019-08-26 20:48:36 929

原创 推荐系统遇上深度学习

推荐系统遇上深度学习系列文章撷取特征交叉系列系列文章撷取在简书上看到这一系列文章,非常喜欢,可惜排版不够好,因此转录到这里,供随时查阅。(全部链接来自简书–石晓文的学习日记特征交叉系列推荐系统遇上深度学习(一)–FM模型理论和实践推荐系统遇上深度学习(二)–FFM模型理论和实践推荐系统遇上深度学习(三)–DeepFM模型理论和实践...

2019-07-24 12:09:06 478

海龟交易法则,源代码下载

海龟交易法,源代码,python编写。学习资料。有缘人交流。推荐《海龟交易法则》,值得交易者学习的灵魂小书。

2020-03-12

storm剖析(pdf)

深入学习storm的好书。适合已进阶的同学阅读。感觉看后受益良多

2018-11-23

storm基础培训

storm基础,入门必备书。不错的资源。学习大数据实时流开发必备

2018-11-22

spark大数据处理

讲述了使用scala开发spark的相关教程,可谓深入浅出。值得学习

2018-11-22

通过互信息进行特征选择

综述性论文,如何使用互信息来进行特征选择。特征工程是机器学习最重要的领域之一,本文深入浅出介绍了特征选择的一个方向。

2018-11-22

基于j2ee的Ajax宝典

非常经典的Ajax书籍,Ajax进阶书。

2009-10-28

linux常用命令全集

不错的linux系统命令帮助手册,查阅十分方便!

2009-10-06

数据挖掘概念与技术(中文版)

本书是数据挖掘经典教材,作者为韩家炜。该书是中文版,详细描述了数据挖掘的各项相关知识:数据仓库,聚类,分类,等等。

2009-09-27

javascript教程

很好的基础及进阶教程,里面例子可直接运行。另有html、xml等相关内容

2009-09-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除