2014乘风破浪2014-CSDN博客

原创 What does shot mean？

前言最近看了一些论文，反复提到一个词：shot。那么shot究竟指的是什么？通过查阅资料和思考后，进行一下总结。Shot都在哪里出现？首先，根据牛津词典，shot的一种解释是the act of firing a gun，或者 an attempt to score a goal or point in a game。shot在目前火热的各个领域都有出现：少样本学习（few-shot l...

2020-04-12 18:42:44 531 2

身体不适，躺了一天，终于现在好一些了。论文被撤稿，难过了很久。前一段和一个很棒的师姐聊天，说道，不要抱着投了就能中的心态，论文要边写边读，琢磨怎么展示自己的想法，心急吃不了热豆腐。反省一下自身，我确实是急功近利了。想想自己选择这条路的初衷，为何不能平心净气的慢慢来呢？老姐给我推荐了几本关于写作的书籍，她是我目前为止最敬佩的人之一，那就是不断地丰富自己充实自己。想起高中时期，我最喜欢的，是把事情...

2020-04-01 19:52:11 401

原创杂记2020/1/24

前言今天是农历2019新年的最后一天，所有工作尘埃落定，终于可以平心静气地写一些文字。实习从19年年初来京，跑了好多个公司找实习，算是阴差阳错地找到一家很不错的公司。虽然名气不大，但是leader人很nice，能力也强，我几乎没有参与工程，全部时间都花在调研上。实习时间长达4个月，独自租房，往返学校上课，暑假的时候，我的体重竟然达到了历史最轻，确实辛苦。中间和leader交流，每次都是慌的不...

2020-01-24 11:37:41 3135 2

原创元学习——meta-learning

前言称不上多熟悉这个领域，毕竟还没有系统调研。最近读了两篇论文，权当总结。学习优化器简介 : 在这种方法中，一个网络（元学习器meta-learner）学习更新另一个网络（学习器learner），以便学习器高效地学习任务。为了更好地优化神经网络，人们对这种方法进行了广泛的研究。元学习器通常是循环网络，以便记住之前是如何校正学习器模型的.论文：OPTIMIZATION AS A MODEL ...

2019-05-05 18:17:29 4372 4

原创强化学习（五）——Sarse和Q-learning

前言Sarse和Q-learning：类属于时序差分方法，因此就不难理解，两者对价值函数的更新公式中，都是先对当前时刻的收获G(t)G(t)G(t)进行了近似。此外，两种方法也都是属于无模型的强化学习，即agent对环境的状态转移概率是未知的，需要与环境互动。其中，Sarse是时序差分在线控制算法，Q-learning是时序差分离线控制算法。离线算法和在线算法：判断的依据是生成样本的pol...

2019-04-29 11:17:41 1451

原创强化学习(四)——蒙特卡洛和时序差分

强化学习中有两类问题，一是预测问题，即已知，二是控制问题，即。TD有偏差，但方差小MC无偏差，但方差大偏差：预测值与真实值之间的差距方差：预测值与期望之间的差距，关注预测值的离散程度。...

2019-04-27 19:51:48 3013

原创强化学习(六)——策略梯度Policy Gradient

本篇文章主旨不在从头讲述PG，而是通过综合别人的总结，写出自己的理解。按照指出的这些引用，消除那些疑惑的地方。首先放一张图，先明确强化学习中有哪些方法，策略梯度又处在怎样的位置。On-line代表，agent必须和环境交互，一边选取动作一遍学习；Off-line代表，agent既可以直接与环境交互进行学习，也可以从别人的经验里学习。基础&入门了解PG：https://www.cnbl...

2019-04-25 22:31:00 2307

原创杂想2019/3/26

知更鸟女孩时光如梭，转眼间，已经是下学期了。刚刚偷着上课的空儿，把借了一个月的书终于看完了。如果你能看到生死，你会改变命运吗？这个问题明显太大，那换个问题，如果你能看到你的未来，你会改变未来吗？在我很年轻的时候（说的好像我现在很老的样子），看着大哥哥大姐姐上了高中，上了大学，满心羡慕，何时我也能彻底离开家，做我想做的事情。那时候的我是怎样的？心情该很好吧？巴拉巴拉，我想很多人会有这样的幻想。更不...

2019-03-26 21:04:24 425

原创 NLP实习面试经历（小米、去哪儿、美团、三角兽、爱奇艺、阿里）

一早就开始投简历，打算出去实习，连续三四天，我跑了五六家公司，累趴了。下面是我记忆中整理的一些比较深刻的问题，不是全部。小米小爱同学叨叨：第一次面试，还是这么个大公司，心里紧张那肯定是不必说的。早上十点面试，我九点就到了，我面试的小爱同学部门在清河，要不是看到小米的logo，我还以为自己走错地方了。环境比较偏。附近有家庆丰包子，我去吃了早餐，九点半给当时我的联系人打电话，他说“不是说好了十...

2019-03-03 19:57:02 3336 2

原创论文阅读：《Neural Machine Translation by Jointly learning to Align and Translation》

Introduction前人的很多工作都是将神经网络作为传统机器翻译的部件，本篇论文是将神经网络作为一个独立的系统，该系统目标是直接将句子翻译为正确的译文。之前关于encoder-decoder模型的弊端是，将所有源句子的所有信息压缩为一个固定长度的向量。该做法导致神经网络无法很好地处理训练集中的长句子。除此之外，已经有论文证明，基础的encoder-decoder模型随着输入句子长度增...

2018-11-26 18:58:55 372

原创 python 深度学习代码错误集合

module ‘pandas’ has no attribute ‘computation’ 更新一下dask conda update dasktoo many values to unpack 函数方法的返回值个数与接收变量不匹配syntaxerror:positional argument follows keyword argument 指定参数应位于参数列表的最右侧Inde...

2018-08-29 16:50:01 820

原创杂想2018/8/15

突然发现最近《胡言乱语》专栏写的东西有点频繁啊！就是想单纯找个地方，就当是说说话。刚在外面练了大后天上台演讲的稿子，心里还是有点虚。毕竟是第一次，在那么多人面前，用英文介绍我做的东西。这个东西吧，咋说，其实没啥优点，但是排场和面子还是要搭起来的。据说有Q&A环节，我估计会一直说，excuse me ? 英语语调还是一个很重要的问题，说着说着自己都有点听不下去了。不过算是一次锻炼的机...

2018-08-15 20:15:04 261

原创概率论复习（一）：随机变量，分布函数，概率密度

随机试验可以在相同条件下重复进行每次实验的实验结果可能不止一个，而且事先可以明确实验的所有可能结果进行一次实验之前，不能确定哪个结果会出现。随机变量来源：某些随机试验的结果可以用数表示，如每个月的平均降水量，有些随机实验因为样本空间元素不是一个数，无法用数表示。为了将随机实验的结果和实数对应起来，引入随机变量。定义：随机变量是定义在样本空间的实值单值函数。例如，在抛硬币问题...

2018-08-15 20:06:03 10600

原创杂想2018/6/24

好久都没有写博客了，都快忘记了我还有个博客，觉得最近自己什么也没干，没干的定义是没有动脑子。发了篇会议论文，着实让我高兴了几天，但是转念想想，不过是一篇最最低级的论文，里面的模型只能算是简单拼凑，没什么含金量，实验也做的差散落四，甚至一个审稿人直接毫不客气地说，实验结果并不好，所以我拒绝（虽说他的单方面拒绝被其他两个审稿人给压过去了）。懒有惯性，如果经常懒着，不让大脑运转，那么时间久了，就懒得看那...

2018-06-24 16:46:59 288

原创实验——wiki训练词向量

前言下面的步骤是个人实验过程。亲测可行，实验结果是利用维基百科的数据训练了100维的词向量，已完成的词向量分享给大家。附下载链接。大家也可按照实验步骤自行尝试。数据下载我们使用维基百科训练词向量。附：维基百科数据下载地址抽取wiki正文内容下载下来的wiki是XML格式，需要提取其正文内容。无论是python2.7还是3.X版本，我们都可以使用一个开源的解压项目来抽取数据正

2018-01-23 11:22:43 2647

原创年度小结

由来“请各位同学准备年终报告，从XXXX等方面介绍，分为自述和提问两部分……”要完的节奏啊啊啊，赶紧来练嘴皮子。话说，编辑器不能同时打开两个，否则后一个会把前一个挤掉。。。这是我的第二版，o(╥﹏╥)o。。。。这不是技术文，只是一个大致描述。论文简述《基于CRF模型的地名识别方法研究和应用_崔婷婷》语料为英文。首先对原始语料进行词性标注，然后把语料分为训练语料和测试语料。训练语料使用CRF模型

2018-01-04 09:58:40 312

原创深度学习——优化算法

为什么需要优化算法优化算法可以加快收敛速度（未加入优化的神经网络训练时间比加入优化后时间更短），甚至得到一个更好更小的损失函数值。优化算法能帮你快速高效地训练模型。有哪些优化算法Mini-Batch 梯度下降Momentum 动量梯度下降法RMSpropAdam 提升算法其中Adam提升算法是Momentum和RMSprop两种相结合的算法，接下来我们会依次介绍这四种算法。Mini-Bat

2018-01-03 15:19:28 17429

原创杂想2017/12/28

paper分享会上，论文没讲好，导师脸色不太好，我也很难看。来这边算起来也两个月了，虽说来时没有什么基础，但两个月应该有所进展，至少基础应该稍微有些了，可是还没做好，确实不该。师姐鼓励我，说我是第一次讲论文，没有把握好讲的方法和提前准备，也是正常。其实我知道，在此之前我就跟导师聊过，导师也明确告诉我阅读最后的目标，至少要懂哪里。可是我还是没做到。是我不够努力吗？也许是吧，第一次讲知识点的时候，我花了

2017-12-28 18:39:48 391

原创隐马尔科夫模型——学习算法

前言隐马尔科夫模型有三个基本问题：概率计算问题，学习问题，预测问题。本博客介绍学习问题的监督学习算法和非监督学习算法（EM算法）。阅读本文前请先学习基本概念。什么是学习问题学习问题是一直观测序列O=(o1,o2,...,oT)O=(o_1,o_2,...,o_T)，估计模型λ=(A,B,π)\lambda=(A,B,\pi)参数，使得在该模型下观测序列概率P(O|λ)P(O|\lambda)最

2017-12-23 12:41:08 649

原创隐马尔科夫模型——前向后向算法

前言隐马尔科夫模型有三个基本问题：概率计算问题，学习问题，预测问题。本博客介绍概率计算问题的前向与后向算法。阅读本文前请先学习隐马尔科夫模型——基本概念什么是概率计算问题给定模型λ=(A,B,π)\lambda=(A,B,\pi)和观测序列O=(o1,o2,...,oT)O=(o_1,o_2,...,o_T)，计算在模型下观测序列O出现的概率P(O|λ)P(O|\lambda)结合先前讨论的

2017-12-22 21:26:10 685

原创隐马尔科夫模型——基本概念

前言本文介绍了什么是隐马尔科夫模型及其基本概念。学习资料来自李航《统计学习方法》和网络博客。通过举例加深对模型的理解，阅读本文可以完全掌握隐马的基本原理和符号表示。什么是隐马尔科夫数学定义隐马尔科夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。隐马尔科夫模型λ\lambda可以用三元符号表示：λ=(A,B,π)\lambda=(A,B,\pi)其中A,B,λA,B,\lambda被

2017-12-21 20:43:20 761

原创隐马尔科夫模型——维特比算法

前言隐马尔科夫有三个基本问题：概率问题、学习问题、预测问题。本文主要讨论预测问题的解法——维特比算法。阅读本文的前提是已经明白什么是隐马尔科夫模型（三要素、基本假设）。本文的所有符号及解释，请查看上一篇博客：隐马尔科夫模型——基本概念什么是预测问题预测问题又称之为解码问题，是指：已知状态转移矩阵、观测矩阵和观测序列，求该序列下最有可能的状态序列。已知模型λ=(A,B,π)\lambda=(A,

2017-12-21 19:24:26 719

原创 python汉语正则处理和文本读写

本文由来在做抽取日常短语中地名（包括省市区县街道社区道路）的工作，待处理的文本都是常用语，本身该工作也只是一个小工程，暂时没有花时间学术研究模型，也不太在意准确率。语言是python，有一些bug和处理方法建议，主要是关于中文句子的正则匹配，记录下来以备不时之需。汉字正则和取字符问题问题：需要匹配该句子的规则性很强的部分汉字。例如：我去了长安路买东西。识别路的结果应为“长安路”str=u'我去长安

2017-11-29 19:49:24 497

原创强化学习（三）——动态规划解决MDP

前沿能够用动态规划解决的问题需要满足一下两个特性：最优化结构：将某些整体性问题分解成两个或多个子问题。在得到这些问题的最优解后，我们也就知道了该整体问题的最优解。例如：最短路径问题。重叠子问题：子问题是在不断重复的，这样我们就可以分解后解决问题。我们的MDP问题满足贝尔曼方程。这个方程是一个递归的过程，正因为该方程，我们的MDP问题满足这两个特性。当前是最优步，以后仍旧选择最优步。

2017-11-20 20:03:31 847

原创强化学习（二）——MDP：马尔科夫决策过程

前言本文主要采用了David Silver的RL授课ppt（个人认为英文的ppt比中文更加生动准确），与个人听课理解总结。本文详细地介绍了马尔科夫决策相关理论和目标。读懂本文的前提是已经掌握理解了上一节：http://blog.csdn.net/wqy20140101/article/details/78562890 ok，我们开始吧！马尔科夫状态在我们所处的环境中，接下来会发生什么事情，只取决于上

2017-11-20 16:17:08 1239

原创强化学习（一）——简介

前言本文适合强化学习新手，主要介绍强化学习的基本概念。什么是增强学习增强学习关注的是智能体如何在环境中采取一系列行为，通过不断试错和探索(SequentialDecisionMaking" role="presentation">SequentialDecisionMakingSequentialDecisionMakingSequential Decision Maki

2017-11-17 16:31:05 3042 1

原创 python爬虫初学（一）——基本代码和常见问题

导语本文出自一个第一次接触python爬虫的新手，第一次独立写爬虫。所以很多东西都用的最基础的，没有使用成熟的python爬虫框架，只是请求网页，写正则表达式匹配需要信息。希望对新手的你有所帮助。目标及思路任务：爬取国家统计局http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2016/index.html地理名称信息，包括省市区街道社区乡镇等。

2017-11-17 13:16:40 906

原创 python爬虫初学（二）——使用代理

什么是代理网络代理，是一种特殊的网络服务，允许一个网络终端（一般为客户端）通过这个服务与另一个网络终端（一般为服务器）进行非直接的连接。一个完整的代理请求过程为：客户端首先与代理服务器创建连接，接着根据代理服务器所使用的代理协议，请求对目标服务器创建连接、或者获得目标服务器的指定资源（如：文件）代理在哪些方面有应用突破自身IP访问限制，访问国外站点（俗称“翻墙”）隐藏真实IP：上网者也可

2017-11-16 10:19:49 782

原创分词工具实验(代码示例)

1. 哈工大语言云(python) 功能和形式都很多样化，准确率也很高，但依赖网络，识别速度慢。# -*- coding: utf-8 -*-"""功能：哈工大语言云使用测试时间：2017年11月14日"""import urllib2url_get_base = "http://api.ltp-cloud.com/analysis/?"api_key = '# 输入注册API_KEY'#

2017-11-14 17:17:45 347

原创（一）写在前面的话

研究生涯的方向是自然语言处理，渣渣看着师兄师姐出神入化的学习成果深表钦佩，低头想想自己何时也能到达如此水平，甚至更高一筹？还有各种paper，毕业要求，还能达到么？路是一步一步走的，台阶当然也得一步一步上，恩，不管本渣离他们多远，我会试着努力靠近的。就让此博客见证本人成长的历程，好，走起！

2017-11-02 09:56:58 388

原创 Ubuntu安装Tensorflow

由于我的ubuntu是最新版的（ubuntu-16.04-desktop-amd64），里面自带的python是2.7.11。因此满足要求。由于tensorflow有三种安装方式，这里采用的是pip安装方式。下面开始安装tensorflow：本篇文章来源于 Linux公社网站(www.linuxidc.com) 原文链接：http://www.linuxidc.com/Linux/2016-0

2017-10-19 10:32:17 338

原创函数常见问题

函数原型即函数声明，告诉编译器有关函数接口的信息，编译器根据函数原型检测函数调用的正确性。由于函数原型没有实现代码，因此不需要参数名，只需要参数类型。函数参数的传递机制1.值传递实际参数的值被赋值到形参，作为形参的初始化。函数体中对形参的访问修改都是在形参上操作的，与实际参数无关。若形参和实参类型不同，将对实参强制类型转换为形参类型，再赋值给形参。 2.引用传递形参类型被定义为引用类型。函

2017-06-29 21:56:37 423

原创 C#调用matlab

生成dll文件准备好要打包的函数（m文件）function [result,m,n] = GetSelfMultiplyResult(list)% 计算矩阵与其转置矩阵的乘积% 测试返回多个结果result = list*list';[m,n] = size(result);endfunction result = GetSelfSquareResult(list)% 计算矩阵各元素

2017-06-15 16:20:06 1341 2

原创 C++类的特性之多态

理解多态是指，不同类型的对象对于同一消息产生不同的行为。消息是指，对类的成员函数的调用，行为是指，成员函数的不同实现。在c++中多态分为两种：编译时的多态和运行时的多态。编译时的多态是通过函数重载或运算符重载实现的，运行时多态是通过继承和虚函数实现的。对应两种编译方式，动态联编和静态联编。联编的意思是，把一个标识符和一个内存地址联系起来的过程。静态联编是在程序运行之前完成的，动态联编是在程序进行的时

2017-05-29 11:57:02 330

原创 hihocoder 完全背包

小Ho现在手上有M张奖券，而奖品区有N种奖品，分别标号为1到N，其中第i种奖品需要need(i)张奖券进行兑换，并且可以兑换无数次，为了使得辛苦得到的奖券不白白浪费，小Ho给每件奖品都评了分，其中第i件奖品的评分值为value(i),表示他对这件奖品的喜好值。现在他想知道，凭借他手上的这些奖券，可以换到哪些奖品，使得这些奖品的喜好值之和能够最大。#include <iostream>#includ

2017-05-02 16:27:11 659

原创机器学习（八）：寻找数据的分组——k均值聚类

理解聚类聚类是一种无监督的机器学习任务，可以将数据自动分成类，或具有类类似的分组。我们可能都不知道我们在寻找什么，聚类是用来知识发现而不是预测。简单地说，就是对无标签的数据进行分类k均值聚类涉及将n个案例分配到k个类中的一个，其中k是一个提前定义好的数，目标是最小化每个类内部的差异，最大化类之间的差异。该算法使用了一个可以找到局部最优解的启发式过程。两个阶段：将案例分配到初始的k个类中，其次，根据落

2017-04-30 17:30:25 2501

原创机器学习（七）探寻模式——基于关联规则的购物篮分析

理解分析结果是一组指定商品之间关系模式的关联规则。例如{花生酱，果冻}–>面包。购买前两种就极有可能购买面包。Apriori算法现实中，许多潜在的商品组合极少，不是一个一个地评估集合的每一个元素。例如：{机油，口红}这两个物品的组合就可能很少。这样就限制了搜索的范围，该算法采用一个简单的先验信念作为准则来减少关联规则的搜索空间：一个频繁项集（集合）的所有子集也是频繁的。比如，如果{机油，口红}是频繁

2017-04-30 16:25:42 3847

原创机器学习（六）：黑箱方法——神经网络和支持向量机

理解人工神经网络：（ANN）对一组输入信号和一组输出信号之间的关系进行建模，使用的模型来源于人类大脑。激活函数：这个过程涉及对总的输入信号求和，和确定是否能满足激活阈值。如果满足，神经元传递信号，否则，不操作。又称为阈值激活函数。激活函数有很多，自变量是输入和，因变量是输出值，他们之间的差异主要是输出信号的范围不同。要认识到，许多激活函数，影响输出信号的输入范围值是相对较窄的。过高或者过低的输入

2017-04-30 12:25:16 4720

原创机器学习（五）：回归方法——预测数值型数据

理解回归关注的是一个唯一的因变量（预测变量）和一个或多个数值型自变量之间的关系。首先假设因变量和自变量之间遵循线性关系。单一线性回归：只有一个单一的自变量多元回归：多个自变量概念普通最小二乘估计：（最小二乘法）不多叙述相关系数：范围在-1到1之间，越靠两端证明越相关，接近0表示不存在线性关系。一般0.1-0.3为弱相关，0.3-0.5中相关，大于0.5为强相关。多元回归第二个公式里面的自

2017-04-29 17:08:17 2378

原创机器学习（四）：分而治之（下）——规则学习

理解：规则分类使用的是独立而治之的探索法。通过确定训练数据中覆盖一个子案例的规则，然后从剩余的数据中分离出该区域。随着案例的增加，更多的数据子集会被分离，直到整个数据集都被覆盖，不再有案例残留。（可以理解为多个嵌套的if-else）。独立而治之算法又称为覆盖算法，规则成为覆盖规则。比如说，你在一群不同种类的动物中需要分开哺乳动物和非哺乳动物，你第一个规则可能是陆地动物，然后你发现青蛙也在这一类中

2017-04-29 10:54:45 1742

空空如也

空空如也