- 博客(23)
- 资源 (3)
- 收藏
- 关注
原创 stanfordnlp使用自定义分词分句
最近做实验需要用到stanfordnlp工具构造dependency tree,我的数据是已经分好词的,但是用stanfordnlp跑了之后,发现它自己重新分的词与原始分词不符,就会导致误差和一系列麻烦,所以着手修改源码。stanfordnlp使用方法见链接:https://stanfordnlp.github.io/stanfordnlp/installation_usage.html要求p...
2020-01-14 19:32:21 2083
原创 MASS: Masked Sequence to Sequence Pre-training for Language Generation阅读笔记
文章目录模型实验和结果Pre-trainingFine-tuningNMTtext summarizationconversational response generation模型主要思想就是受到bert的启发,在生成领域搞一个预训练模型。作者提出一个无监督的预测任务:给定一个句子x∈X,对其中从u到v的token进行掩盖,形成一个序列:被遮盖的token统一用一个标识符替换:模...
2019-06-16 22:34:19 892
原创 Bilingual Sentiment Embeddings: Joint Projection of Sentiment Across Languages论文笔记
Bilingual Sentiment Embeddings论文笔记前言模型Cross-lingual ProjectionSentiment ClassificationJoint LearningTarget-language Classification前言这篇文章主要是为了做跨语言的情感分析,提出了一种embedding的方法。核心思想就是将两种不同的语言映射到同一个向量空间上。这样...
2019-06-07 13:40:00 371
原创 Deep contextualized word representations (ELMo) 阅读笔记
ELMo (Embeddings from Language Models)引入了一种新的深度上下文单词表示,不仅能对单词使用的复杂特征(如语法和语义)进行建模,还能根据上下文语境的不同做出改变(一词多义)。与传统的单词类型嵌入不同,每一个token的表示是整个输入句子的函数。它们是在带有字符卷积的两层biLMs上计算的双向语言模型给定N个token的序列,(t1,t2,……,tN...
2019-05-26 15:58:59 292
原创 《An Attentive Survey of Attention Models》论文阅读笔记
IJCAI 2019的文章,对注意力机制做的综述。地址:https://arxiv.org/abs/1904.02874注意力机制的高速发展有三个原因:1、这些模型取得了state-of-the-art的结果。2、注意力机制可以被用来提升神经网络的可解释性。不然NN只能被理解为一个黑盒。3、有助于克服递归神经网络(RNNs)的一些挑战,如随着输入长度的增加而导致的性能下降和由于...
2019-05-12 20:12:44 1144 3
原创 ng Machine Learning课程笔记(3)——Neural Networks神经网络
动机:只是简单的增加二次项或者三次项之类的逻辑回归算法,并不是一个解决复杂非线性问题的好办法。因为当n很大时,将会产生非常多的特征项。任何一个不是输出层或输入层的都被称为隐藏层。如果把前面的输入层和隐藏层遮住,只剩下最后一个隐藏层和输出层,那么这个模型看起来就像是逻辑回归。只不过输入不再是特征x,变成了前面隐藏层的输出。因此,神经网络可以在前面的隐藏层中经过调整θ值(权重),计算出更好的特...
2018-12-12 15:23:58 143
原创 ng Machine Learning课程笔记(2)——Logistic Regression逻辑回归与Overfitting过拟合
Logistic Regression逻辑回归二分类问题考虑到二分类问题,一种方法是用线性回归,所得结果大于0.5的归类为1,小于0.5的归类为0,但是这种方法存在问题,因为分类问题本身并不一定是线性的。如果增加一个距离很远的点,拟合得到的直线就会出问题,从而得不到想要的结果。应用逻辑回归时,希望得到的结果在0-1之间,我们使用Sigmoid Function,也成为Logisti...
2018-11-02 21:24:32 469
原创 ng Machine Learning课程笔记(1)——Linear Regression线性回归
回归问题:输出是实数分类问题:输出是固定的离散值在一个模型中,m表示训练集的数量,x表示输入,y表示输出,上标(i)表示数据在训练集中的索引。单变量的线性回归:使用梯度下降(gradient descent)的算法,调节θ的值。设定初始的θ值,然后逐步改变θ,使J(θ1,θ2)减小,直到达到最小值。每个参数是同步下降的。α称为learning rate,学习速率。既...
2018-10-01 23:35:35 212
原创 c#读取excel文件
完整代码在最下面,先说下写的时候遇到了好几个问题。首先是百度c#怎么读excel,得到了这个:string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+"Extended Properties='Excel 8.0'";DataSet ds = new DataSet();OleDbDa...
2018-08-07 19:31:13 2600
原创 《Java核心技术》卷1——学习笔记(2)
第四章1,Java总是采用按值调用,方法得到的是所有参数值的一个拷贝,不能修改传递给它的任何参数变量的内容。一个方法不能修改一个基本数据类型的参数(即数值型或布尔型一个方法可以改变一个对象参数的状态。一个方法不能让对象参数引用一个新的对象。2,如果类中提供了至少一个构造器,但是没有提供无参数的构造器,则在构造对象时如果没有提供参数就会被视为不合法。3,如果构造器的第一个语句形如 thi...
2018-08-05 12:44:14 332
原创 《Java核心技术》卷1——学习笔记(1)
第三章的基本语法1、类名命名规范为骆驼命名法,即首字母大写。2、源代码为.java文件,编译后字节码文件为.class。控制台先用javac name.java命令编译源文件,然后用java name运行编译后的字节码文件。3、三种注释方法://第一种/* 第二种 *//**第三种*/第三种可以用来自动生成文档。/* */注释不能嵌套,也就是说,不能简单地...
2018-08-02 14:55:37 4749 1
转载 刨根问底,你知道:hover等4个伪类为什么要按顺序排列吗
:link,:visited,:hover,:active这4个伪类大家都不陌生,4个伪类要按照LvHa这个爱恨原则来排(外国友人起的记忆方法),不然有些效果会出问题。但是你们都想过这几个属性为什么要按顺序排吗?
2017-03-15 12:37:54 825
原创 cookie未设置path引发的大坑……
知道答案之后发现这个问题很弱智,但是这种小东西往往也是很容易疏忽的……昨天,我要写一段代码,就是通过cookie判断用户正在浏览的界面,然后高亮菜单栏相应的那个菜单。一开始是这么写的……function highLight(obj){ var x=$(obj).index(); document.cookie=encodeURIComponent("navInd
2016-12-03 20:07:26 21671 2
转载 前端基础知识科普
本篇内容是我搜集资料整理所得,姑且算是转载吧1、DOCTYPE当我们用Dreamweaver或者Sublime新建一个html文件的时候,往往会看到编辑器自动帮我们生成一些代码,像这样:或者这样:那么,总是出现在第一行的DOCTYPE到底是什么东西?又起到什么作用? 声明是指示 web 浏览器关于页面使用哪个 HTML 版本进行编写的指令,如果没有这
2016-10-06 19:35:07 555
转载 跨站脚本攻击详解
1 前言近年来,随着Web2.0的大潮,越来越多的人开始关注Web安全,新的Web攻击手法层出不穷,Web应用程序面临的安全形势日益严峻。跨站脚本攻击(XSS)就是常见的Web攻击技术之一,由于跨站脚本漏洞易于出现且利用成本低,所以被OWASP开放式Web应用程序安全项目(OWASP,Open Web Application Security Project)列为当前的头号Web安全威
2016-09-27 22:02:43 5010
转载 浅析return false的正确使用
“return false”之所以被误用的如此厉害,是因为它看起来像是完成了我们交给它的工作,浏览器不会再将我们重定向到href中的链接,表单也不会被继续提交,但这么做到底有什么不对呢可能在你刚开始学习关于jQuery事件处理时,看到的第一个例子就是关于如何阻止浏览器执行默认行为,比如下面这段演示click事件的代码:$("a.toggle").click(function () {
2016-08-21 09:04:10 16635 1
转载 对input设置height在非ie浏览器下失效
对input控件设置CSS属性时,如果对其高度height进行设置后,在IE上可以正确显示,但是如果在Safair、Chrome、Firefox等WebKit为核心的浏览器上却实效。/* 这样设置只对IE有效,对其他内核的浏览器无效 */input { height:30px
2016-07-10 11:04:50 2137 1
信息检索导论中文版
2018-12-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人