自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (2)
  • 问答 (15)
  • 收藏
  • 关注

原创 真正理解指针生成网络——Summarization with Pointer-Generator Networks

文本摘要的主要方式:文本摘要的主要方式分为两种,一种是抽取式(extractive),另一种是生成式(abstractive)抽取式是根据词语重要性、句子重要性排序,抽取出重要度高的句子,从而形成摘要,主要是对文本的选择,过程相对更容易,但是对于复杂的文本时,很难仅仅通过选择文本来形成摘要,如小说生成式则是通过自然语言处理,输出简洁、流畅、保留关键信息,更像人进行摘要的过程,设计到生成,过程...

2019-06-03 17:03:01 13962 19

原创 From Word Embeddings To Document Distances 阅读笔记

本文主要解决文本相似度问题,在word2vec, BOW的基础上提出了WMD模型(Word Mover’s Distance),主要思想是将A文档中的每个词,通过最小距离的转移到B文档中对应的词,最终将每个距离相加,作为衡量两个文档的距离。WMD是无超参数的,而且可解释性高。在一些nlp任务中取得了不错效果。背景介绍:解决这类问题的常见思路如下:文档最常用的两种表示方式BOW和TF-IDF...

2020-03-15 21:19:15 355

原创 动态规划十大经典案例(Dynamic Programming Practice Problems)

动态规划(Dynamic Programming)是求多阶段决策过程(Multistep Decision Process)最优化的一种数学方法,它将问题的整体按时间或空间的特征分成若干个前后衔接的时空阶段,把多阶段决策问题表示为前后有关的一系列单阶段决策问题,然后逐个求解,从而求出整个问题的最有决策序列。它强调了时间和空间的连续性。如果没有基础知识,建议参看关文忠教授(退休)的运筹学课程中了...

2020-02-17 22:17:20 5264

原创 机器学习常见评估指标

开篇:最近回顾了系列的算法学习资料,整理了算法的学习流程,从问题出发,怎么用算法解决实际业务中的case。当接到需求时,首先需要深入了解需求场景,将需求转换为算法可以解决的问题,我们大部分遇到的是分类和回归的场景。需要我们深入理解问题,收集足够多的数据,从不同的纬度分析,对该问题完成建模。对于需求场景中定义成问题,完成问题的建模,这是最重要的部分。接下来都是一些套路的流程,对数据进行特征抽取,...

2020-01-01 17:32:07 386

原创 深度剖析知识增强语义表示模型——ERNIE

文章目录什么是语义表示静态词向量动态词向量(上下文词向量)位置编码ERNIE的原理介绍神经网络上的改造辅助任务学习过程ERNIE的应用案例性能不敏感的场景:直接使用ERNIE 的模型蒸馏案例:搜索问答Query识别和QP匹配离线推荐无监督文本的深度神经网络的出现,nlp领域又火了起来,深度神经网络大大提升了nlp任务的效果。虽然早期的网络也是基于上下文进行的向量建模,但是由于单向信息流的弊端,效...

2019-12-10 13:16:33 5101

原创 剑指offer之python篇(四)

文章目录061 二叉搜索树的第k个结点062 数据流中的中位数063 滑动窗口的最大值064 矩阵中的路径065 机器人的运动范围061 二叉搜索树的第k个结点给定一棵二叉搜索树,请找出其中的第k小的结点。例如, (5,3,7,2,4,6,8) 中,按结点数值大小顺序第三小结点的值为4。# -*- coding:utf-8 -*-# class TreeNode:# def...

2019-07-30 07:52:05 119

原创 剑指offer之python篇(三)

文章目录041 和为S的两个数字042 左旋转字符串043 翻转单词顺序列044 扑克牌顺子045 孩子们的游戏046 求1+2+3+...+n047 不用加减乘除做加法048 把字符串转成整数049 数组中重复的数字050 构建乘积数组051 正则表达式匹配052 表示数值的字符串053 字符流中第一个不重复的字符054 链表中环的入口结点055 删除链表中重复的结点056 二叉树的下一结点05...

2019-07-30 07:46:12 156

原创 剑指offer之python篇(二)

文章目录021 栈的压入、弹出序列022 从上往下打印二叉树023二叉树的后序遍历024 二叉树中和为某一值的路径025 复杂链表的复制026 字符串的排列027 数组中出现超过一半的数字028 最小的K个数029 连续子数组的最大和030 整数中1出现的次数031 把数组排成最小的数032 丑数033第一个只出现一次的字符034数组中的逆序对035 两个链表的第一个公共结点036 数字在排序数组...

2019-07-29 21:45:30 164

原创 剑指offer之python篇(一)

文章目录001 二维数组的查找002 替换空格003从尾到头打印链表004 重建二叉树005 用两个栈实现队列006旋转数组的最小数字007 斐波那契数列008 跳台阶009 变态跳台阶010 矩形覆盖011 二进制中1的个数012 数值的整数次方013 调整数组顺序使奇数位于偶数前面014 链表中倒数第k个节点015 反转链表016 合并两个排序的链表017 树的子结构018 二叉树的镜像019...

2019-07-29 21:21:18 193

原创 (三) nginx高可用搭建

一、准备四台虚拟机192.168.159.3 nginx 、keepalived 192.168.159.3 nginx 、keepalived 192.168.159.3 tomcat4 192.168.159.3 tomcat42 二、nginx的安装步骤以及负载均衡的搭建(一)如何快速安装tengine (二)ngi...

2019-07-24 12:43:20 352

原创 (二)nginx的负载均衡小例子

1、分别准备两台虚拟机安装tomcat (1)192.168.159.6 (2)192.168.159.52、修改上一章节安装的tengine中的nginx.conf,此文件一定是/etc/init.d/nginx中指定的文件,避免修改tengine中的文件,不起作用。nginx的安装请见(一)如何快速安装tengine...

2019-07-24 12:42:56 548

原创 (一)如何快速安装tengine

在可以联网的环境下,yum安装无疑是最简单的。安装tengine依赖,命令: yum install -y gcc openssl-devel pcre-devel zlib-devel 2、创建安装tengine的安装目录,我在/opt/soft/learn/下创建nginx,命令:mkdir nginx 3、解压下载的tengine-2.1...

2019-07-24 12:42:29 433

原创 crf++ 之中文实体识别初步实现

本文选用crf++工具包在windows上实现中文实体识别。任务是提取时间、人物、地点及组织机构名。文件下载:工具包下载:官网:http://chasen.org/~taku/software/CRF++/#features百度网盘:https://pan.baidu.com/s/1apZx8wd3xXGgMs_WUQeuSg提取码:o7fh语料文件下载百度网盘:https://pa...

2019-07-16 11:39:23 441

原创 rasa搭建项目可用多轮对话系统(二)

例子

2019-07-13 08:51:39 2321

原创 rasa搭建多轮对话系统(一)

本文主要讲述搭建过程:安装rasa:1、安装rasa_corepip install rasa_core执行上面的命令这时可能会出现C++环境问题如下这里提供了C++的文件在windows中双击安装即可。网盘地址:https://pan.baidu.com/s/1kQvBw1dg8qzF-e7DvH8TWw提取码:ef5y这步安装中可能出现jupyter与ipython的prom...

2019-07-12 20:58:03 5847 1

原创 最新语言表示方法——XLNet

ContextAutoregressive vs AutoencodingXLNet: Best of both worldsPermutation Language modelTwo-Stream self-attention mechanismRecurrence mechanism

2019-07-01 16:33:16 1043

原创 文本表示方法(BOW、N-gram、word2vec)

sd

2019-06-17 15:56:25 2386

原创 一步步理解bert

文章目录NLPWord Embedding缺点:RNN/LSTM/GRUseq2seq缺点:Contextual Word EmbeddingNeural Network Language ModelNLPNLP:自然语言处理(NLP)是信息时代最重要的技术之一。理解复杂的语言也是人工智能的重要组成部分。而自google在2018年10月底公布BERT在11项nlp任务中的卓越表后,BERT(...

2019-06-15 09:03:17 2905

原创 阅读理解之(bidaf)双向注意力流网络

阅读理解机器理解(machinechensition,mc),回答关于给定上下文段落的查询,需要对上下文和查询之间的复杂交互进行建模。近年来,注意力机制已经成功地扩展到了MC。通常,这些方法使用注意力集中在上下文的一小部分,并用一个固定的大小向量对其进行总结,暂时地耦合注意力,和/或经常形成单向注意力。本文介绍了双向注意流(bidaf)网络,它是一个多阶段的层次化过程,它在不同的粒度级别上表示...

2019-06-12 10:06:38 7055 6

nginx安装包

tengine是nginx的升级版,更加稳定,支持高并发、解决负载均衡问题。

2016-10-19

tengine-2.1.0.tar.gz

2016-10-19

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除