自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (3)
  • 收藏
  • 关注

原创 价廉物美的Github仓库

现在我们去Github上找代码一般都会找星星数很多的repo,因为他们的代码基本都是质量比较高的:可读性高、运行效率高等等。但其实我经常也会在Github上发现一些星星数很低,代码质量却非常好的repo,可能因为他们的星星数比较低,所以在人们搜索的时候很难被发现。因此,我也整理了一份我发现的上述所谓的“星星数很低,代码质量却非常好的repo”列表。目前列表主要都是关于深度学习中的推荐算法和CTR模型,也会持续更新下去,也欢迎大家将自己平时发现的一些“星星数很低,代码质量却非常好的repo”列举出来,

2020-06-03 22:55:41 138

原创 《Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba》简单实现

图神经网络在这几年开始流行起来,并在业界有了不少成功的实践。阿里在2018年发表的这篇论文《Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba》便是一个图网络很好的落地应用。论文提出他们的模型(GES, EGES) 正是可以解决数据的可扩展性、稀疏性、冷启动等问题,并增加了 item 的额外信息(例如...

2020-05-05 10:29:49 338

翻译 [翻译]深入理解word2vec

原文链接:http://mccormickml.com/2019/03/12/the-inner-workings-of-word2vec/本文链接:https://download.csdn.net/download/bound2020/11177557目录:引言欢迎来到我的word2vec电子书。无论你是正在学习机器学习先进理论的学生、或者是正在探索新技术和新想法的研究员、...

2019-05-14 14:47:54 478

原创 GBDT浅谈以及代码实现

GBDT作为近年很热门的模型,其性能非常突出,用途也是涵盖了从特征选择到分类、回归,被广大从业者和爱好者所使用。网上关于gbdt的原理和数学推导已经有很多,我就谈谈我个人的浅见,如有错误还望指正。同时还附上我自己实现的简单的python代码,功能比较简单,并且性能也不高,只作为自己对模型的理解,欢迎拍砖。从大的框架来说,主要可以分解成两个部分:构建树和梯度提升。GBDT中的树一般都是CAR

2016-11-30 19:13:10 14232 1

原创 youtubenet简单代码实现

youtubenet_modelfrom config import *import timeclass Model(): def __init__(self, item_dict): self.embedding_size = 128 self.item_count = len(set(item_dict[:, 0])) self.item_dict = item_dict self.brand_count = 10.

2020-12-13 22:49:54 1200

原创 eges v3

import collectionsimport mathimport datetimeimport tensorflow as tffrom config import *data = []id_map_raw = np.loadtxt(os.path.join(DATA_PATH, 'id_mapping'), dtype=str, delimiter='\t')id_map = {id_map_raw[i, 0]: int(id_map_raw[i, 1]) for i in ra..

2020-11-22 22:20:41 219 1

原创 eges cold start

import collectionsimport mathimport datetimeimport tensorflow as tfimport itertoolsfrom collections import defaultdictfrom config import *embedding_size = 128n_sampled = 500batch_size = 1024num_steps = 20001 # data_size / batch_size * n_epo..

2020-11-22 22:19:51 154

原创 keras官方文档

把keras的官方英文文档整理成了pdf格式,方便阅读。https://download.csdn.net/download/bound2020/11287017

2019-07-08 12:16:12 314

原创 UserCF的MapReduce实现

用户协同过滤(UserCF)在推荐系统刚出来的时候,使用的比较多,但随着技术的发展以及业务场景的限制,现在只使用协同过滤的推荐系统已经不多了,具体的原理和细节网上有很多,也就不在这里赘述了。我最近在实现一个推荐系统的时候,需要用到UserCF,而在UserCF中最核心的东西就是计算每个用户的相似度,得出相似用户之后再根据这些用户看过的或者点击过的东西去做推荐。计算相似度的方法有很多,就不在这一一列...

2018-07-13 16:18:38 515

原创 python技巧

以下是我从网上和书上找到的有用并且也是pythonic的技巧,其中大部分都已经用在自己代码里了。大部分都是对于python 2.7,而对于python 3的以后也会另外整理一份。用位运算判断奇偶性:def is_even(x):    return False if x & 1 else True循环时, 使用 while 1 比 while True 更快!文件相关操作:os.chdir...

2018-04-25 15:04:15 375

原创 【牛客网】全排列

链接:https://www.nowcoder.com/questionTerminal/5632c23d0d654aecbc9315d1720421c1来源:牛客网[编程题]全排列热度指数:2860时间限制:1秒空间限制:65536K算法知识视频讲解给定一个由不同的小写字母组成的字符串,输出这个字符串的所有全排列。我们假设对于小写字母有'a' < 'b' < ... < 'y'...

2018-04-24 21:40:40 337

原创 【牛客网】完数VS盈数

链接:https://www.nowcoder.com/questionTerminal/ccc3d1e78014486fb7eed3c50e05c99d来源:牛客网[编程题]完数VS盈数热度指数:3781时间限制:1秒空间限制:65536K算法知识视频讲解一个数如果恰好等于它的各因子(该数本身除外)子和,如:6=3+2+1。则称其为“完数”;若因子之和大于该数,则称其为“盈数”。求出2到60之间...

2018-04-09 22:08:02 172

原创 【牛客网】今年的第几天?

链接:https://www.nowcoder.com/questionTerminal/ae7e58fe24b14d1386e13e7d70eaf04d来源:牛客网[编程题]今年的第几天?热度指数:3945时间限制:1秒空间限制:65536K算法知识视频讲解输入年、月、日,计算该天是本年的第几天。输入描述:包括三个整数年(1<=Y<=3000)、月(1<=M<=12)、日...

2018-04-09 21:42:42 136

原创 【牛客网】特殊乘法

[编程题]特殊乘法热度指数:3777时间限制:1秒空间限制:65536K 算法知识视频讲解写个算法,对2个小于1000000000的输入,求结果。 特殊乘法举例:123 * 45 = 1*4 +1*5 +2*4 +2*5 +3*4+3*5 输入描述:两个小于1000000000的数输出描述:输入可能有多组数据,对于每一组数据,输出Input中的两个数按照题目要求的方法进行运算后得到的结果。示例1输...

2018-04-09 21:38:40 155

原创 【牛客网】代理服务器

链接:https://www.nowcoder.com/questionTerminal/1284469ee94a4762848816a42281a9e0来源:牛客网[编程题]代理服务器热度指数:4643时间限制:1秒空间限制:65536K算法知识视频讲解    使用代理服务器能够在一定程度上隐藏客户端信息,从而保护用户在互联网上的隐私。我们知道n个代理服务器的IP地址,现在要用它们去访问m个服务...

2018-04-06 13:44:37 1366 2

原创 【牛客网】最小邮票数

链接:https://www.nowcoder.com/questionTerminal/83800ae3292b4256b7349ded5f178dd1来源:牛客网[编程题]最小邮票数热度指数:3741时间限制:1秒空间限制:65536K算法知识视频讲解    有若干张邮票,要求从中选取最少的邮票张数凑成一个给定的总值。    如,有1分,3分,3分,3分,4分五张邮票,要求凑成10分,则使用3...

2018-04-04 20:41:27 235

原创 【牛客网】二叉树遍历

链接:https://www.nowcoder.com/questionTerminal/4b91205483694f449f94c179883c1fef?toCommentId=1221019来源:牛客网[编程题]二叉树遍历热度指数:5769时间限制:1秒空间限制:65536K算法知识视频讲解编一个程序,读入用户输入的一串先序遍历字符串,根据此字符串建立一个二叉树(以指针方式存储)。例如如下的先...

2018-04-04 20:38:36 478

原创 【牛客网】成绩排序

链接:https://www.nowcoder.com/questionTerminal/3f27a0a5a59643a8abf0140b9a8cf1f7来源:牛客网[编程题]成绩排序热度指数:6224时间限制:1秒空间限制:65536K算法知识视频讲解用一维数组存储学号和成绩,然后,按成绩排序输出。输入描述:输入第一行包括一个整数N(1<=N<=100),代表学生的个数。接下来的N...

2018-04-04 20:35:35 527

原创 【牛客网】手机键盘

链接:https://www.nowcoder.com/questionTerminal/20082c12f1ec43b29cd27c805cd476cd来源:牛客网[编程题]手机键盘热度指数:4875时间限制:1秒空间限制:65536K算法知识视频讲解按照手机键盘输入字母的方式,计算所花费的时间如:a,b,c都在“1”键上,输入a只需要按一次,输入c需要连续按三次。如果连续两个字符不在同一个按键...

2018-04-04 20:32:21 245

原创 并查集简单实现

假设现在有个很简单的需求:想把每个只有一个元素的组或者类别合并到相邻(间隔为1)的组中,来减少组的数量。这时,第一个想到的解决方案就是用并查集:维护一个字典,首先列出所有单个元素的组,键和值都是组的编号。若某组相邻的组也只有单个元素,则将该组的值更新为相邻组号,重复查找直到找不到为止。下面直接上python代码,因为比较简单,也就不加注释了。val_one = {k: v for k, v

2017-01-13 10:33:28 423

keras官方英文文档

keras官方文档, 英文版的,整理成pdf格式,方便阅读

2019-07-05

深入理解word2vec.pdf

翻译自http://mccormickml.com/2019/03/12/the-inner-workings-of-word2vec/

2019-05-14

Machine Learning An Algorithmic Perspective

绝对完整版,没有hidden pages

2014-01-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除