桂小Z-CSDN博客

原创 stanfordnlp使用自定义分词分句

最近做实验需要用到stanfordnlp工具构造dependency tree，我的数据是已经分好词的，但是用stanfordnlp跑了之后，发现它自己重新分的词与原始分词不符，就会导致误差和一系列麻烦，所以着手修改源码。stanfordnlp使用方法见链接：https://stanfordnlp.github.io/stanfordnlp/installation_usage.html要求p...

2020-01-14 19:32:21 2083

原创 MASS: Masked Sequence to Sequence Pre-training for Language Generation阅读笔记

文章目录模型实验和结果Pre-trainingFine-tuningNMTtext summarizationconversational response generation模型主要思想就是受到bert的启发，在生成领域搞一个预训练模型。作者提出一个无监督的预测任务：给定一个句子x∈X，对其中从u到v的token进行掩盖，形成一个序列：被遮盖的token统一用一个标识符替换：模...

2019-06-16 22:34:19 892

原创 Bilingual Sentiment Embeddings: Joint Projection of Sentiment Across Languages论文笔记

Bilingual Sentiment Embeddings论文笔记前言模型Cross-lingual ProjectionSentiment ClassificationJoint LearningTarget-language Classification前言这篇文章主要是为了做跨语言的情感分析，提出了一种embedding的方法。核心思想就是将两种不同的语言映射到同一个向量空间上。这样...

2019-06-07 13:40:00 371

原创 Deep contextualized word representations (ELMo) 阅读笔记

ELMo (Embeddings from Language Models)引入了一种新的深度上下文单词表示，不仅能对单词使用的复杂特征（如语法和语义）进行建模，还能根据上下文语境的不同做出改变（一词多义）。与传统的单词类型嵌入不同，每一个token的表示是整个输入句子的函数。它们是在带有字符卷积的两层biLMs上计算的双向语言模型给定N个token的序列，(t1，t2，……，tN...

2019-05-26 15:58:59 292

原创《An Attentive Survey of Attention Models》论文阅读笔记

IJCAI 2019的文章，对注意力机制做的综述。地址：https://arxiv.org/abs/1904.02874注意力机制的高速发展有三个原因：1、这些模型取得了state-of-the-art的结果。2、注意力机制可以被用来提升神经网络的可解释性。不然NN只能被理解为一个黑盒。3、有助于克服递归神经网络(RNNs)的一些挑战，如随着输入长度的增加而导致的性能下降和由于...

2019-05-12 20:12:44 1144 3

原创 ng Machine Learning课程笔记（3）——Neural Networks神经网络

动机：只是简单的增加二次项或者三次项之类的逻辑回归算法，并不是一个解决复杂非线性问题的好办法。因为当n很大时，将会产生非常多的特征项。任何一个不是输出层或输入层的都被称为隐藏层。如果把前面的输入层和隐藏层遮住，只剩下最后一个隐藏层和输出层，那么这个模型看起来就像是逻辑回归。只不过输入不再是特征x，变成了前面隐藏层的输出。因此，神经网络可以在前面的隐藏层中经过调整θ值（权重），计算出更好的特...

2018-12-12 15:23:58 143

原创 ng Machine Learning课程笔记（2）——Logistic Regression逻辑回归与Overfitting过拟合

Logistic Regression逻辑回归二分类问题考虑到二分类问题，一种方法是用线性回归，所得结果大于0.5的归类为1，小于0.5的归类为0，但是这种方法存在问题，因为分类问题本身并不一定是线性的。如果增加一个距离很远的点，拟合得到的直线就会出问题，从而得不到想要的结果。应用逻辑回归时，希望得到的结果在0-1之间，我们使用Sigmoid Function，也成为Logisti...

2018-11-02 21:24:32 469

原创 ng Machine Learning课程笔记（1）——Linear Regression线性回归

回归问题：输出是实数分类问题：输出是固定的离散值在一个模型中，m表示训练集的数量，x表示输入，y表示输出，上标(i)表示数据在训练集中的索引。单变量的线性回归：使用梯度下降（gradient descent）的算法，调节θ的值。设定初始的θ值，然后逐步改变θ，使J(θ1，θ2)减小，直到达到最小值。每个参数是同步下降的。α称为learning rate，学习速率。既...

2018-10-01 23:35:35 212

原创 c#读取excel文件

完整代码在最下面，先说下写的时候遇到了好几个问题。首先是百度c#怎么读excel，得到了这个：string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+"Extended Properties='Excel 8.0'";DataSet ds = new DataSet();OleDbDa...

2018-08-07 19:31:13 2600

原创《Java核心技术》卷1——学习笔记（2）

第四章1，Java总是采用按值调用，方法得到的是所有参数值的一个拷贝，不能修改传递给它的任何参数变量的内容。一个方法不能修改一个基本数据类型的参数（即数值型或布尔型一个方法可以改变一个对象参数的状态。一个方法不能让对象参数引用一个新的对象。2，如果类中提供了至少一个构造器，但是没有提供无参数的构造器，则在构造对象时如果没有提供参数就会被视为不合法。3，如果构造器的第一个语句形如 thi...

2018-08-05 12:44:14 332

原创《Java核心技术》卷1——学习笔记（1）

第三章的基本语法1、类名命名规范为骆驼命名法，即首字母大写。2、源代码为.java文件，编译后字节码文件为.class。控制台先用javac name.java命令编译源文件，然后用java name运行编译后的字节码文件。3、三种注释方法：//第一种/* 第二种 *//**第三种*/第三种可以用来自动生成文档。/* */注释不能嵌套，也就是说，不能简单地...

2018-08-02 14:55:37 4749 1

原创各排序算法对比

直接插入排序、折半插入排序、希尔排序。冒泡排序、快速排序。简单选择排序、堆排序。归并排序、基数排序。

2017-09-09 09:54:38 306

原创串的模式匹配

1. 简单的模式匹配 2. 首尾模式匹配 3. KMP算法

2017-09-08 11:21:32 738

原创基于nodejs与websocket的加密认证聊天室

课程设计做的实验，简单把实现过程贴上来

2017-06-13 15:49:13 2099

原创 IE8,IE7兼容问题整合

最近调IE8以下程序调的想死，掺和着数据处理，各种问题出现，现做出归纳整理。

2017-05-16 13:50:06 1647

原创 ie7下Ext-3.4打开iframe出现空白的问题

事实证明，不是诡异，错还在我……

2017-05-06 16:27:42 1285

转载刨根问底，你知道:hover等4个伪类为什么要按顺序排列吗

:link,:visited,:hover,:active这4个伪类大家都不陌生，4个伪类要按照LvHa这个爱恨原则来排（外国友人起的记忆方法），不然有些效果会出问题。但是你们都想过这几个属性为什么要按顺序排吗？

2017-03-15 12:37:54 825

原创 jQuery+ajax+php实现注册登录功能

含html代码，jquery代码，php代码

2017-02-04 09:24:03 18031 9

原创 cookie未设置path引发的大坑……

知道答案之后发现这个问题很弱智，但是这种小东西往往也是很容易疏忽的……昨天，我要写一段代码，就是通过cookie判断用户正在浏览的界面，然后高亮菜单栏相应的那个菜单。一开始是这么写的……function highLight(obj){ var x=$(obj).index(); document.cookie=encodeURIComponent("navInd

2016-12-03 20:07:26 21671 2

转载前端基础知识科普

本篇内容是我搜集资料整理所得，姑且算是转载吧1、DOCTYPE当我们用Dreamweaver或者Sublime新建一个html文件的时候，往往会看到编辑器自动帮我们生成一些代码，像这样：或者这样：那么，总是出现在第一行的DOCTYPE到底是什么东西？又起到什么作用？声明是指示 web 浏览器关于页面使用哪个 HTML 版本进行编写的指令，如果没有这

2016-10-06 19:35:07 555

转载跨站脚本攻击详解

1 前言近年来，随着Web2.0的大潮，越来越多的人开始关注Web安全，新的Web攻击手法层出不穷，Web应用程序面临的安全形势日益严峻。跨站脚本攻击（XSS）就是常见的Web攻击技术之一，由于跨站脚本漏洞易于出现且利用成本低，所以被OWASP开放式Web应用程序安全项目（OWASP，Open Web Application Security Project）列为当前的头号Web安全威

2016-09-27 22:02:43 5010

转载浅析return false的正确使用

“return false”之所以被误用的如此厉害，是因为它看起来像是完成了我们交给它的工作，浏览器不会再将我们重定向到href中的链接，表单也不会被继续提交，但这么做到底有什么不对呢可能在你刚开始学习关于jQuery事件处理时，看到的第一个例子就是关于如何阻止浏览器执行默认行为，比如下面这段演示click事件的代码：$("a.toggle").click(function () {

2016-08-21 09:04:10 16635 1

转载对input设置height在非ie浏览器下失效

对input控件设置CSS属性时，如果对其高度height进行设置后，在IE上可以正确显示，但是如果在Safair、Chrome、Firefox等WebKit为核心的浏览器上却实效。/* 这样设置只对IE有效，对其他内核的浏览器无效 */input { height:30px

2016-07-10 11:04:50 2137 1

信息检索导论中文版

本书是一本讲授信息检索的经典教材。全书共 21 章，前八章详述了信息检索的基础知识，包括倒排索引、布尔检索及词项权重计算和评分算法等，后十三章介绍了一些高级话题，如基于语言建模的信息检索模型、基于机器学习的排序方法和 Web 搜索技术等。另外，本书还着重讨论了文本聚类技术这一信息检索中不可或缺的组成部分。全书语言流畅，由浅入深，一气呵成。本书适合作为高等院校相关专业高年级本科生和研究生的课程教材，也可供信息检索领域的研究人员和专业人士参考。

2018-12-05

看懂10张图成为JS小牛

2015-11-02

离散数学第三版方世昌课后习题答案

离散数学第三版方世昌课后习题答案，有详细解答

2015-11-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

信息检索导论中文版

看懂10张图成为JS小牛

离散数学第三版 方世昌课后习题答案

空空如也

离散数学第三版方世昌课后习题答案