自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Angus的学习笔记

这里记录一些博主个人的学习笔记,博主目前研究方向是推荐系统领域,专注于负采样工作。

  • 博客(13)
  • 资源 (4)
  • 收藏
  • 关注

原创 GANs(生成对抗网络)浅析

机器学习众多算法,经典如决策树,罗吉斯特回归等,以及近些年热火朝天的众多深度神经网络模型,其本质终究是分类器。2014年发表在人工智能顶会NIPS上的一篇文章《Generative Adversarial Networks》一举成名,在CV,NLP等众多领域都取得了突出性的成果。今天让我们一起来看下这一“神”算法究竟是如何工作的。目录1. 欢迎来“对抗”1.1 生成假数据1.2 鉴别假数据2. GAN的基本结构解析2.1 基本结构2.2 训练方式3. 相关理论推导3.1

2021-05-04 15:16:06 1439 1

原创 Seq2Seq 模型详解

在NLP任务中,我们通常会遇到不定长的语言序列,比如机器翻译任务中,输入可能是一段不定长的英文文本,输出可能是不定长的中文或者法语序列。当遇到输入和输出都是不定长的序列时,可以使用编码器-解码器(encoder-decoder)模型或者seq2seq模型。其基本思想是编码器用来分析输入序列,解码器用来生成输出序列。首先,来简单介绍下RNN(循环神经网络)结构:1. RNN 结构RNN结构RNN中,每个单元接受两个输入,一个是当前时间步输入的信息 XtX_tXt​,另一个是上一个单元的隐藏层状态 H

2021-04-20 16:14:59 22636 5

原创 论文笔记:BPR-Bayesian Personalized Ranking from Implicit Feedback | 推荐系统BPR算法分析

BPR:Bayesian Personalized Ranking from Implicit Feedback文章目录BPR:Bayesian Personalized Ranking from Implicit Feedback1. 背景2. 问题建模3. BPR基本思想4. 算法中的应用1. 背景在2. 问题建模3. BPR基本思想4. 算法中的应用...

2021-04-14 14:42:21 1998 11

原创 推荐系统ALS算法浅述

概览从协同过滤的分类来说,ALS(Alternating Least Squares,交替最小二乘)算法属于User-Item CF,也叫做混合CF。它同时考虑了User和Item两个方面。用户和商品的关系,可以抽象为如下的三元组:<User,Item,Rating>。其中,Rating是用户对商品的评分,表征用户对该商品的喜好程度。ALS算法是基于模型的推荐算法。其基本思想是对稀疏矩阵进行模型分解,评估出缺失项的值,以此来得到一个基本的训练模型。然后依照此模型可以针对新的用户和物品数据进

2021-04-12 21:02:55 728 1

转载 Graph Neural Networks in Recommender Systems综述

本文仅用来学习,原创作者公众号:图与推荐原文链接:https://zhuanlan.zhihu.com/p/323302898 原文链接:https://arxiv.org/pdf/2011.02260.pdf Abstract 如今推荐系统的研究非常火热,GNN也在很多领域表现优异。推荐系统主要的挑战是从历史交互(historical interactions)和边信息(side .

2021-04-08 10:25:47 702 1

转载 机器学习/深度学习中为什么要做特征归一化/标准化?

【转载自】深入探讨:为什么要做特征归一化/标准化?(如若侵权请联系删除谢谢)为什么?Feature scaling,常见的提法有“特征归一化”、“标准化”,是数据预处理中的重要技术,有时甚至决定了算法能不能work以及work得好不好。谈到feature scaling的必要性,最常用的2个例子可能是:特征间的单位(尺度)可能不同,比如身高和体重,比如摄氏度和华氏度,比如房屋面积和房间数,一个特征的变化范围可能是[1000, 10000],另一个特征的变化范围可能是[−0.1,0.2],在进行距离有

2021-03-21 16:06:01 2455 1

原创 浅析:从最大似然估计(MLE)、最大后验估计(MAP)到期望最大算法(EM)

浅析:最大似然估计(MLE)、最大后验估计(MAP)和EM算法最近阅读推荐系统领域的一些文章后,感觉最深的是在采样是对概率论方面理论知识的要求颇高。且建立优化目标时,广泛应用MLE、MAP、EM等优化方法。本文在参考一些优秀的博客后简单给出自己对于三种优化方法的粗鄙理解。1. 最大似然估计算法(Maximum Likelihood Estimation,MLE)在我看来MLE本质上就是一种用频率估计概率的思想。举个简单的例子,我们小学时候都学过祖冲之的投针实验,当时是为了估算圆周率 π\piπ。其基

2021-03-07 10:41:38 2222 1

原创 论文笔记:On Sampled Metrics for Item Recommendation

On Sampled Metrics for Item Recommendation论文链接:https://dl.acm.org/doi/abs/10.1145/3394486.3403226 accepted by KDD20201. 研究目标由于在个性化推荐中物品(item)的数量十分之大,且在数据集中,对于每一位用户而言,未交互的数据量十分大,无法得知哪些物品是用户不喜欢的,大多数得到的是用户喜欢的物品,因此难以得到有效的负样本用于模型的训练,故大多数算法都采用采样的方法从未交互的物品中

2021-03-03 22:07:50 550 3

原创 ILP——指令级并3:Tomasolu技术

二、Tomasolu技术核心结构——Reservation Stations和上篇介绍的记分牌技术相比,Tomasolu技术不同的地方在于将Function unit status改为Reservation Stations。下面先介绍Reservation Stations的组成部分OpVjVkQjQkBusyA部件所进行的操作源操作数1的值源操作数2...

2020-04-25 20:58:08 936

原创 ILP——指令级并行2:记分牌(Scoreboard)技术

硬件方法的指令级并行为什么要用硬件调度方案?因为有时候编译时无法确定相关。基本思想:允许stall后的指令继续向前流动(这么说可能有点抽象,简单的理解就是若是你因为相关被stall了,就让你后面的没有被stall的指令先来,很现实的一个思路),这种思路导致了一个基本特点:顺序发射,乱序执行举个简单的例子:银行取钱假设某银行是流水线操作,取钱依次经过 取号,填单子,柜台取钱,开凭据,拿回存...

2020-04-25 11:22:01 3929

原创 ILP——指令级并行1:软件方法

ILP——指令级并行1软件方法的指令级并行循环展开基本块的定义直线型代码,无分支;单入口;程序由分支语句连接基本块构成循环级并行第一个思路是调整循环中的指令顺序,以减少因为相关产生的stall数实例如下:Loop: LD F0,0(R1) ;F0=vector element ADDD F4,F0,F2 ;add scalar from F2 SD 0(R1)...

2020-04-25 11:07:19 1111

原创 计算机网络(自顶向下方法):第一章 绪论

文章目录@[toc]1. 因特网的概念与服务2. 网络边缘3. 网络核心4. 分组交换中的时延5. 网络协议的分层1. 因特网的概念与服务构成:端系统(主机),分组交换机,网络协议,ISP(Internet Service Provider)实际上因特网就是将计算机连在一起的子网络构成的网络分组交换机:常见有路由器和链路层交换机路由器常用于网络核心中,链路层交换机常用于接入...

2019-09-12 12:37:08 485

原创 周志华老师西瓜书读书笔记——第一章:绪论

文章目录1. 基本术语2. 假设空间3. 归纳偏好4. 机器学习发展过程中几大思想5. 机器学习&数据挖掘6.习题Q&A1. 基本术语中文English数据集data set样本sample属性空间attribute space样本空间sample space训练集training set标记label回归r...

2019-09-10 11:01:05 303 1

算法实现最长公共子序列问题(动态规划和KR算法)

算法导论实验:动态规划实现最长公共子序列问题,python实现; KR算法c语言实现。 附实验报告以及相关KMP算法的调研。

2021-04-08

红黑树与区间树算法实现

算法导论实验:使用c++实现红黑树的建立,插入,旋转,删除,查找全操作以及区间树的全操作。并带有红黑树的可视化展示,采用graphviz工具,需要自行安装graphviz以实现树的可视化功能。

2021-04-08

平面上n个点之间最近点对问题

算法导论实验:利用分治法求平面上n个点最近点对问题,压缩包内附python源代码和实验报告以及详细时间复杂度分析。

2021-04-08

大整数除法C语言实现

c语言实现的大整数除法, 新手小白程序设计入门参考。

2018-12-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除