自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (1)
  • 收藏
  • 关注

原创 阿里、腾讯、百度、快手NLP自然语言处理实习生面经

两年制硕士,今年春季开始找暑期实习,只有一个项目,一个比赛,一段本科时大厂数据分析的实习经历,无论文,直到5月24才等来了阿里的意向书,按照时间顺序,写一下具体面试内容,我就是人菜要求多的典范,小厂看不上,简历都没投,大厂投了要不是简历挂要不就是一面挂,磕磕绊绊俩月了,终于有大厂收我了简历挂的厂:微软字节(后来发笔试通知了,但我没做)好未来搜狗美团(笔试做完取消面试了,也没人捞我)4.6 腾讯一面(挂)1、自我介绍(一般会详细问简历中第一个项目或者比赛(除非面试官有比较偏好的

2021-05-24 19:42:56 572

原创 《A Discourse-Aware Attention Model for Abstractive Summarization of Long Documents》论文笔记

《A Discourse-Aware Attention Model forAbstractive Summarization of Long Documents》论文笔记长文档生成式摘要的话语感知注意模型摘要Introduction模型如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导

2020-05-14 14:48:47 656

原创 第七章-深度学习中的正则化技术

深度学习中的正则化技术1、前言2、参数范数惩罚2.1L^2参数正则化2.2 L^1参数正则化Bagging和其他集成方法Dropoutbagging与dropout训练对比1、前言以增大训练误差为代价来减少测试误差,这些策略统称为正则化。2、参数范数惩罚我们讨论各种范数惩罚对模型的影响。在神经网络中,我们通常只对每一层仿射变换的权重做惩罚而不对偏置做正则惩罚。2.1L^2参数正则化最...

2019-11-28 13:59:24 415

原创 深度前馈网络

深度前馈网络1、前言2、实例XOR3、基于梯度的学习4、隐藏单元5、结构设计6、BP及其他微分算法7、历史小记1、前言2、实例XOR3、基于梯度的学习4、隐藏单元5、结构设计6、BP及其他微分算法7、历史小记...

2019-11-27 21:54:27 324

原创 统计学习方法-PageRank算法-读书笔记

统计学习方法-PageRank算法-读书笔记1、前言2、PageRank定义3、PageRank迭代算法3.1幂法3.2代数算法1、前言PageRank算法是图链接分析的代表算法,属于图数据上的无监督学习方法。算法的基本思想是在有向图上定义一个随机游走模型,即一阶马尔可夫链,描述随机游走者沿着有向图随机访问各个结点的行为。PageRank算法表示这个马尔可夫链的平稳分布。2、PageRa...

2019-11-19 11:25:29 521

原创 统计学习方法-潜在狄利克雷分配(LDA)-读书笔记

统计学习方法-潜在狄利克雷分配(LDA)-读书笔记1、前言2、狄利克雷分布3、潜在迪利克雷分配模型3.1LDA和PLSA3.2生成过程1、前言LDA是文本集合的生成概率模型。假设每个文本由话题的一个多项分布表示,每个话题由单词的一个多项分布表示,特别假设文本的话题分布的先验分布是狄利克雷分布,话题的单词分布的先验分布也是狄利克雷分布。LDA能更好解决过拟合现象。LDA模型是含有隐变量的概率图...

2019-11-19 09:47:03 1617

原创 统计学习方法-马尔可夫链蒙特卡罗法-读书笔记

统计学习方法-马尔可夫链蒙特卡罗法-读书笔记1、前言2、蒙特卡罗法2.1随机抽样2.2树学期望估计2.3积分计算3、马尔可夫链3.1基本定义3.2连续状态马尔可夫链3.3马尔可夫链的性质4、马尔可夫链蒙特卡罗法4.2吉布斯抽样(Gibbs Sampling)1、前言蒙特卡罗法(也称为统计模拟方法),是通过从概率模型的随机抽样进行近似数据的计算方法。MCMC则是以马尔可夫链为概率模型的蒙特卡罗法...

2019-11-18 19:38:46 795

原创 统计学习方法-概率潜在语义分析(PLSA)-读书笔记

统计学习方法-PLSA-读书笔记1、前言2、概率潜在语义分析模型2.1生成模型2.2共现模型3、概率潜在语义分析算法1、前言概率潜在语义分析,是一种利用概率生成模型对文本集合进行话题分析的无监督学习方法。模型的最大特点是用隐变量表示话题,整个模型表示文本生成话题,话题生成单词,从而得到单词-文本共现数据的过程。2、概率潜在语义分析模型2.1生成模型P(d)表示生成文本d的概率,P(z|d...

2019-11-18 15:25:07 569

原创 统计学习方法-潜在语义分析(LSA)-读书笔记

统计学习方法-LSA-读书笔记1、前言2、LSA2.1矩阵奇异值分解算法2.2非负矩阵分解算法1、前言文本数据挖掘中最简单的方法是利用向量空间模型(vector space model,VSM),也就是但词向量空间模型,创造一个单词-文本矩阵,矩阵中的值通常采用单词在文本中出现的频数或权值表示。它是一个稀疏矩阵。权值通常采用单词频率-逆文本频率(TF-IDF)表示,定义为TFIDFij=t...

2019-11-18 14:12:08 442

原创 统计学习方法-PCA-读书笔记

![在这里插入图片描述](https://img-blog.csdnimg.cn/20191115151另外一种方法

2019-11-18 11:00:19 707 1

原创 统计学习方法-聚类方法-读书笔记

统计学习方法-聚类方法-读书笔记1、前言2、聚类的基本概念2.1相似度或距离2.2类或簇2.3类与类之间的距离3、层次聚类4、K均值聚类1、前言聚类事针对给定的样本,依据他们的特征和相似度或距离,将其归并到若干个类或簇的数据分析问题。聚类属于无监督学习。2、聚类的基本概念2.1相似度或距离聚类的核心概念是相似度或距离。①闵可夫斯基距离距离越大,相似度越小,距离越小,相似度越大。di...

2019-11-15 11:17:46 398

转载 统计学习方法-条件随机场-读书笔记

转自条件随机场

2019-11-14 16:12:59 193

原创 统计学习方法-隐马尔可夫模型(HMM)-读书笔记

统计学习方法-隐马尔可夫模型(HMM)-读书笔记1、前言2、隐马尔可夫模型2.1隐马尔科夫模型的定义2.2 HMM的两个假设3、HMM的三个基本问题3.1概率计算问题3.11直接计算法3.12前向算法3.13后向算法3.2学习算法3.21监督学习方法3.22无监督学习方法-Baum-Welch算法3.3预测算法3.31近似算法3.32维比特算法1、前言隐马尔科夫模型(hidden Markov...

2019-11-14 15:27:31 503

原创 统计学习方法-EM算法-读书笔记

统计学习方法-EM算法-读书笔记1、前言2、EM算法3、高斯混合模型(GMM)1、前言EM算法是一种迭代算法,用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。每次迭代由两部分组成:E步,求期望;M步,求极大值,直至收敛。隐变量:不能被直接观察到,但是对系统的状态和能观察到的输出存在影响的一种变量。2、EM算法(1)选择参数的初始值θ(0)\theta(0)θ(0),开始迭...

2019-11-13 15:54:42 306

原创 统计学习方法-提升方法-读书笔记

统计学习方法-提升方法-读书笔记1、前言2、提升方法AdaBoost算法2.1AdaBoost算法2.2 前向分步算法3、提升树3.1二分类问题3.2回归问题3.3梯度提升(GBDT)1、前言提升(boosting)是一种常用的统计学习方法,是集成学习的一种。它通过改变训练样本的权重(概率分布),学习多个弱分类器(基本分类器),并将这些分类器线性组合来构成一个强分类器提高分类性能。2、提升方...

2019-11-13 11:58:28 257 1

原创 统计学习方法-支持向量机-读书笔记

统计学习方法-支持向量机-读书笔记1、前言2、线性可分支持向量机2.1线性可分支持向量机2.2 函数间隔2.3 几何间隔2.4 硬间隔最大化2.5 对偶算法2.6支持向量和间隔边界3、线性支持向量机3.1对偶函数3.2合页损失函数4、非线性支持向量机4.1 算法4.2常用核函数4.3 序列最小最优化(SMO)算法1、前言支持向量机(support vector machines,SVM)是一种...

2019-11-12 20:16:03 307

原创 统计学习方法-逻辑斯蒂回归与最大熵模型-读书笔记

统计学习方法-逻辑斯蒂回归与最大熵模型1、前言2、逻辑斯蒂回归模型2.1 逻辑斯蒂分布2.2 二项逻辑斯蒂回归模型2.3 模型参数估计2.4 多项逻辑斯蒂回归3、最大熵模型3.1 最大熵原理3.2 最大熵模型4、算法4.1 改进的迭代尺度法IIS4.2 拟牛顿法4.3 梯度下降法1、前言逻辑斯蒂回归(logistic regression)是统计学习中经典的分类方法。最大熵是概率模型学习的准则...

2019-11-12 11:41:19 317

原创 统计学习方法-决策树-读书笔记

统计学习方法-决策树-读书笔记1、前言2、模型3、策略4、算法4.1特征选择4.11信息增益4.12 信息增益比4.2决策树生成4.21 ID3算法4.22 C4.5算法4.3 决策树的剪枝4.31剪枝算法4.4 CART算法4.41介绍4.42 回归树生成4.43 基尼指数4.44 分类树的生成4.45 CART剪枝5、问题1、前言决策树是一种基本的分类与回归方法。它可以认为是if-then...

2019-11-11 17:49:49 260

原创 统计学习方法-朴素贝叶斯法-读书笔记

1、前言朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实际上学习到生成数据的机制,所以属于生成模型。2、模型朴素贝叶斯法通过训练数据集学习联合概率分布p(x,y),具体做法是学习先验概率分布p(y)与条件概率分布p(x,...

2019-11-11 11:03:09 303

原创 统计学习方法-K近邻法-读书笔记

1、前言K近邻法是一种基本分类与回归方法。K近邻法是根据其K个最近邻的训练实例的类别,通过多数表决等方式进行预测,k值得选择,距离度量,分类决策规则是K近邻法得三个基本要素,K=1时,称为最近邻算法。2、模型当训练集,距离度量,k值以及分类决策规则确定后,特征空间已经根据这些要素被划分为一些子空间,且子空间里每个点所属得类也被确定。3、策略3.1 距离特征空间中两个实例点的距离是相似程...

2019-11-08 12:17:48 231

原创 统计学习方法-第二章感知机-读书笔记

统计学习方法-感知机-读书笔记1、前言2、感知机模型2.1感知机几何解释3、感知机学习策略3.1数据集的线性可分3.2点到线的距离3.3样本到超平面的距离3.4损失函数4、感知机学习算法4.1原始形式算法4.2对偶形式算法4.3原始形式和对偶形式的选择5遗留问题1、前言感知机为线性分类模型,属于判别模型。是神经网络和支持向量机的基础。感知机学习旨在求出将训练数据进行线性化分的分离超平面。2...

2019-11-07 15:56:39 373

原创 实习面试经——京东,新浪,滴滴,快手,转转,字节跳动

本来想着拿到offer就来写的,结果拖到现在,想着大三小学期之后,先找到一份实习,有个实习经历,秋招更容易一些,所以从7月中旬一直找到七月底,两周,终于找到了,按照时间顺序,慢慢来。学的计算机,不知道要找什么实习,所以在最开始的一周什么都有投递,平台大多是在实习僧,拉勾网,boss直聘这些。字节跳动——测试实习生 7.16下午5.15(一个小时左右)没有想过要去做测试,主要是师哥内推一...

2019-07-28 22:39:26 3842

原创 南昌网络赛 H. Coloring Game 思维题 快速幂

题面题目就是一个找规律地题,主要wa了好多次原因是没有想到用快速幂。AC代码#include<algorithm>#include<cassert>#include<cstdio>#include<cmath>#include<ctime>#include<cstring>#include<s...

2019-04-23 16:54:11 216

原创 libcudnn.so.7: cannot open shared object file: No such file or directory

不同的版本:cudnn:7.1.1cuda:9.0.176tensorflow:1.6.0Ubuntu:16.04 我经历了两次这样的错误,每次都费事费力,终于找到最终解决方法了 安装CUDA 9.0# instructions from https://developer.nvidia.com/cuda-downloads (linux -&gt; x86_...

2018-10-27 12:01:28 3229

原创 Coursera-机器学习-吴恩达-5 过度拟合

过度拟合问题从图中可以看出来,最后一个过度拟合,由于特征变量 过多,导致拟合过度,而第一个是特征较少拟合不充分导致。解决过度拟合的两个选择:1、减少特征数量。①手动选择保留的tezh特征。②使用模型选择算法。2、正则化①保留所有特征,减少参数大小。②当我们有很多特征的时候,正则化很有效果。代价函数是正则化参数。正则线性回归梯度下降...

2018-08-09 21:37:14 249

原创 机器学习-Coursera-4逻辑回归

假设函数对于监督学习,有线性回归和分类两种,对于分类来说所得的结果是离散的,但是我们可以忽略y是离散值的事实来处理分类问题,并使用我们的旧线性回归的算法来尝试预测给定的x。要解决y∈{0,1}时,取大于1或小于0的值的问题,我们可以改变假设函数的形式 也就是说,满足,通过插入logistic函数来完成。我们使用“Sigmoid函数”,也称为“逻辑函数”: 下图显示sig...

2018-08-07 21:12:55 178

原创 机器学习-Coursera-3多变量线性回归

假设函数Hθ(x )=θ0+θ1X1+θ2X2+θ3X3+⋯+θñXñ使用矩阵乘法的定义,多变量假设函数可以简单表示为 hθ(x)=[θ0 θ1... θn]=θTx为了方便起见,将x0设置为1成本函数J(θ)=1/2m(hθ(x(i))-y(i))^2    多变量的梯度下降重复直至收敛: :=− (()−)*in other words:re...

2018-08-05 15:42:34 246

原创 机器学习-coursera-2 单变量线性回归

模型表示具有一个变量的线性回归也称为“单变量线性回归”。当您想要从单个输入x预测单个输出yshi时,使用单变量线性回归。进行监督学习,这意味着我们已经知道输入/输出的结果了。假设函数我们假设函数具有一般形式:ÿ^=Hθ(x )=θ0+θ1X       我们将尝试各种theta0和theta2值,找到提供最佳“拟合”或最具代表性的“直线”的值。成本函数我们可以使用成...

2018-08-04 21:08:52 249

原创 机器学习-coursera-1基本定义 监督学习 无监督学习

一 机器学习定义①旧的非正式定义:研究领域,使用计算机无需明确编程即可学习。②现代定义:一个计算机程序可以从经验E中学习某些任务T和性能量度P,如果在T中的任务中表现(由P测量)随经验E而提高。 eg.玩西洋棋E=玩许多次西洋棋的经验T=玩西洋棋的任务P=程序赢得一场比赛的概率 二 监督学习 无监督学习一般来说,任何机器学习问题都可以被分为两大类:监督学习,无监...

2018-08-04 16:34:24 201

原创 Javascript条形图-微信支付宝市场占有率

&lt;!DOCTYPE html&gt;&lt;html&gt;&lt;head&gt; &lt;meta charset="utf-8"&gt; &lt;title&gt;bigdata&lt;/title&gt;&lt;/head&gt;&lt;body&gt;  &lt;h1 align="center"&gt;201

2018-03-27 22:26:26 487

ICLR 2018论文合集

ICLR论文合集,此篇收集了2018的所有论文,希望对各位同学有用,论文合集,论文合集,论文合集,论文合集。

2020-02-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除