自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(137)
  • 资源 (1)
  • 收藏
  • 关注

原创 从HMM到MEMM再到CRF

1. HMM  HMM是一种生成式模型,它的理论基础是朴素贝叶斯,本质上就类似于我们将朴素贝叶斯在单样本分类问题上的应用推广到序列样本分类问题上。在单样本朴素贝叶斯分类任务中:P(y∣x)=P(x∣y)∗P(y)P(x)P(y|x)=\frac{P(x|y)*P(y)}{P(x)}P(y∣x)=P(x)P(x∣y)∗P(y)​扩展到序列化样本分类问题任务中为:P(y1n∣x1n)=P(...

2019-04-04 14:45:21 4003

原创 Texlive中jpg和pdf转成eps

提交论文时出现内嵌字体问题,主要原因是我用的图片是pdf格式的,而这些pdf是通过visio另存为得到的,包含一些中文字体,导致提交出错,将pdf图片改成eps就没有问题了。1.jpg转为eps找到texlive的安装路径下的bin目录,比如我的路径为C:\\texlive\\2018\\bin,下面有一个目录叫win32,在这个目录下有一个小程序bmeps.exe,这个程序就是将图像(可以是...

2019-04-02 13:44:22 2517

原创 pytorch中获取指定位置元素

  这段代码的应用场景是:某个batch的sentence,有的经过了padding操作,如果获取每句话中实际的最后一个单词。A = torch.Tensor([[[2, 3, 1], [1, 4, 0], [1, 0, 0]], [[2, 2, 0], [2, 0, 0], [3, 1, 4]]])print(A.size())B = torch.Tensor([[3, 2, 1], [...

2018-10-31 21:28:44 19676

原创 pytorch中查看可训练参数

  pytorch中我们有时候可能需要设定某些变量是参与训练的,这时候就需要查看哪些是可训练参数,以确定这些设置是成功的。  pytorch中model.parameters()函数定义如下: def parameters(self): r"""Returns an iterator over module parameters. This is typ...

2018-10-15 12:30:37 21361

原创 线性条件随机场代码解读

  NER中CRF是必不可少的环节,特地看了一遍CRF相关理论以及allennlp中CRF的代码,特在这里笔记记录下来!1.线性CRF简介1.1一般形式  关于线性条件随机场的详细介绍,请参考李航老师的《统计学习方法》或者这里,这里仅仅给出一般的公式定义。   设P(Y|X)P(Y|X)P(Y|X)为线性链条件随机场,则在随机变量XXX取值为xxx的条件下,随机变量YYY取值...

2018-09-03 21:20:56 1655 4

原创 python3.6找到不_sqlite3模块

  在pytorch中要使用tensorboard,在使用的时候出现一个错误,提示:ModuleNotFoundError: No module named '_sqlite3'字面意思,就是找不到sqlite3模块,所以用了以下方法解决该错误。1.安装sqlite3   使用sqlite3 --help来判断是否已经安装sqlite3,如下所示,表示已经安装了sqlite3: ...

2018-08-15 16:48:26 11107

原创 ELMo代码详解(二)

ELMo代码解读笔记2:模型代码2.模型代码介绍  模型代码主要包括以下几个部分:1.构建word embedding; 2.构建word_char embedding的准备; 3.语言模型介绍(双向lstm模型)。2.1 构建word embedding  注意:在ELMo语言模型中,无论是word embedding还是word_char embedding都是...

2018-07-24 13:53:40 11138 13

原创 ELMo代码详解(一):数据准备

ELMo代码解读笔记1.数据准备  数据准备包括:1.生成word的词汇表类; 2.生成字符的词汇表类; 3.以word-ids作为输入的训练batch生成类; 4.以char-ids作为输入的训练batch生成类; 5.生成语言模型输入的数据集类1.1 word词汇表类(Vocabulary)  根据一个词汇表文件,生成word和索引的相互对应关系,即_id_to_w...

2018-06-28 10:22:13 10738 10

原创 计算机论文查找网站

  计算机相关论文一般在google学术和dblp上面找,前者需要翻墙,而后者不用翻墙可以直接访问。链接地址如下: google学术:https://scholar.google.com.hk/?hl=zh-CN dblp网站: https://dblp.uni-trier.de/ 另外查看相关会议和期刊的级别,可以在中国计算机协会(ccf)官网查看,地址为:http://www.ccf....

2018-05-16 12:41:28 13355 5

原创 word2vec源码详解

  已经看了很久的word2vec,但是发现了很多不同版本的解释,再加上原始论文没有提到太多的细节,所以打算直接看一遍源码,一方面可以加深自己理解;另一方面,以后也可以做适当的改进!源码分析请参考本人github地址:https://github.com/liuwei1206/word2vec  先给出源码中执行的流程图,按照流程图对代码进行详细的解读,流程图如下:训练部分的流程图如下:讲解将会按照这个训练过程来!(一)训练参数注意,这些参数都是全局参数,包括以下参数:size: 对应代码

2018-05-09 12:00:11 15064 9

原创 ubuntu中执行jupyter格式代码

(一)安装jupytersudo pip3 install jupyter(二)打开jupyter   先通过cd执行进入你要打开的jupyter项目的目录下,然后执行jupyter notebook就会一个网页,里面会显示该目录的所有文件。如下图: (三)执行jupyter   在显示的所有文件中,打开你要执行的文件,选中某段代码,点击run即可。 ...

2018-04-20 16:43:38 1377

原创 卸载win10装Ubuntu笔记

  之前装的win10系统经常动不动磁盘100%,经常卡机,所以打算卸载掉,然后装上Ubuntu系统。(一)制作一个启动盘(二)进入bios,将boot secure关闭(三)通过Ubuntu启动,可以看到一个选择界面,第一项为try ubuntu without install,第二项为install ubuntu,我们先通过按键盘上的e进入如下界面: 将第二行splash —...

2018-04-19 21:43:40 15988 2

原创 2分法解决逆序对数

  在一个数组中,如果两个元素aiaia_i和ajaja_j,有i&lt;ji&lt;ji < j 并且ai&gt;ajai&gt;aja_i > a_j,我们则成这两个元素对(ai,aj)(ai,aj)(ai, aj)次序出错,是一个逆序对。例如数组[2, 4, 1, 3, 5]中逆序对有3个,分别是(2,1),(4,1),(4,3)(2,1),(4,1),(4,3)(2, 1), (4, 1...

2018-04-13 09:38:35 1493

原创 tensorflow中用saver保存模型

  我们在用tensorflow训练模型时,可能需要训练很长很长一段时间,为了方便下次使用,应该将模型保存起来。在sklearn中,我们可以使用pickle模块进行模型保存;而在tensorflow中,我们可以使用它自带的Saver()类进行模型的保存。(一)Saver类  Saver类是用于保存和恢复变量的。它有将变量保存到checkpoint和从checkpoint中恢复变量的操作...

2018-04-10 14:09:45 5584 3

原创 ubuntu16.04中源码安装仅仅支持CPU的TensorFlow

  直接用pip3安装的tensorflow在运行代码时,总是会提醒另一种更加高效率的编译模式,很烦人,再加上据说在CPU上计算速度会加倍,于是就尝试用tensorflow的源码进行安装,主要参考了TensorFlow官方教程。以下便是安装官方教程的步骤进行安装!!! 注意,本人的安装环境是ubuntu16.04,python3.6,tensorflow1.6, open-jdk8, baz...

2018-04-05 16:26:35 1804 2

原创 skyline point解析

  Skyline query是多维度数据库中一种非常重要的point query,它最初由 Börzsönyi 等人于2001年提出。一个数据库中的数据对象(也就是空间中的点)可能有成千上万个,但是我们往往对其中一些更感兴趣,Skyline就是定义这里的“更感兴趣”的一种方式。如下图所示是美国纽约曼哈顿区的天际线(Skyline),显然这里的建筑有很多很多,但放眼望去我们所能看见的(也就是构成天...

2018-03-30 16:11:18 4295 1

原创 二分图及其判断

  二部图又称为二分图,双分图,指顶点可以分成两个不相交的集合U和V,使得在同一个集内的顶点不相邻的图。无向图为二分图G的充分必要条件是,G至少有两个顶点,且其所有回路的长度均为偶数。  判断某个图是否是二分图可以用着色问题解决。我们从图中任选一个顶点s,并把它着为红色,接着s的邻居必须着为蓝色,然后s邻居的邻居再次作为红色,这样一层一层着色,直到整个图被着色为止;如果在着色过程中产生了冲...

2018-03-21 22:53:28 4816

原创 二分图的最大匹配问题

1.定义二分图:   将一个图的所有顶点划分为两个不相交集U和V,使得图中的每一条边的顶点分别属于点集合U和点集V,即同一点集中的点不构成边,这样的图叫做二分图。维基百科中给出的无向图G的二分图的充分必要条件是:G至少有两个顶点,且其所有回路的长度均为偶数。下图为带有回路的二分图举例: 匹配:   图中匹配的定义是指,这个图的一个边的集合,集合中任意两条边都没有公共的顶点,则称这个边...

2018-03-17 23:14:34 8199

原创 ubuntu安装sublime3并配置python3环境

  最近有一些烦,虚拟机跑代码,跑着跑着存储不够,我就去扩大磁盘,结果虚拟机崩了,试了一上午的修复办法,仍然无法修复,于是只能重装虚拟机,配置各种环境,这里总结一下Ubuntu中配置sublime3,并且配置Python3编译环境。(一)安装sublime3  terminal中安装sublime3步骤为:#添加sublime text3的仓库sudo add-apt-repos...

2018-03-15 10:04:59 5884

原创 Ubuntu16使用theano出错

  最近看了一篇paper,在复现论文代码时,需要用到theano这个机器学习工具(感觉我看了好多个工具,但却都只是了解,好悲伤!!!),然后再本地的Ubuntu16虚拟机里面装这个工具,用一下指令:sudo pip3 install theano因为之前我装过TensorFlow和Pytorch,所以一些依赖包基本已经包括了。我安装的theano版本是1.0.1,python是3.6...

2018-03-13 19:49:35 2254 1

原创 leetcode10:Regular Expression Matching

1.题目如下:'.' Matches any single character.'*' Matches zero or more of the preceding element.The matching should cover the entire input string (not partial).The function prototype should be:boo...

2018-03-11 10:30:09 243

原创 Ubuntu中Python3找不到_sqlite3模块

  今天跑一个代码,出现了一个找不到sqlite3模块的错误,错误如下:from _sqlite3 import *ModuleNotFoundError: No module named '_sqlite3'网上查资料说,因为python3没有自带sqlite3相关方面的支持,要自己先安装然后再重新编译Python,操作如下:安装sqlite3支持组件:&gt;&gt;&gt;...

2018-03-06 21:49:34 6128

原创 pytorch实现LeNet5

  本文需要对卷积神经网络有一定的了解,可以参考本博文。(一)LeNet简介LeNet网络结构如下图所示: 1.第一层C1是一个卷积层 输入图片: 32*32 卷积核大小: 5*5 卷积核种类: 6 输出feature map大小:28*28(32-5+1) 神经元数量:28*28*6 可训练参数数量:(5*5+1)*6,(每个卷积核25个权重值w,一个截距值bias...

2018-03-02 21:25:08 27129 10

原创 spring-boot中使用druid连接池

最近因为项目的要求,需要在spring-boot中配置druid连接池,数据库是Oracle,并且是多数据源的连接池,特地写下我的配置经历。   用的框架是spring-boot,数据库是oracle,数据库操作用的是mybatis,数据库连接池用的是druid。(一)spring和spring-boot  spring-boot相对于spring的改变就是:spring-boot基

2018-02-03 13:20:31 1840

原创 TensorFlow中Variable()和get_variable()

  tf.Variable()和tf.get_variable()都可以用来创建变量,但是前者会自动保证唯一性,而后者不能保证唯一性。1 tf.Variable:Variable(initial_value=None, trainable=True, collections=None, validate_shape=True, caching_d...

2018-02-02 19:56:08 3199

原创 mybatis中SqlSession一定要关闭

今天在使用mybatis查询数据时,出现了一个很奇怪的问题。同一条sql语句,查询时快时慢,并且有一定的规律性,大概每10次查询中有一次会特别特别的慢,快的只需要1ms,慢的要20000ms,sql代码及快慢时间截图如下:select fknr from jq_fkqk where jjxh = ?快的情况: 慢的情况:    通过日志打印mybatis查询信息时,我观察到

2018-01-20 20:57:37 32525 14

原创 AdaBoost详解

本博客内容摘自李航老师的《统计学习方法》,加以一些整理。相关概念  提升(boosting)方法是一种常用的统计学习方法,应用广泛且有效。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。  对于分类问题而言,给定一个训练集,求比较粗糙的分类规则(弱分类器)要比求精确的分类规则(强分类器)容易得多。提升(booting)方法就是从弱学习算法出发,反复

2018-01-04 10:03:34 708

原创 PCA解析

1.例子引入  如图所示,我们要将两类点(红点和蓝点)分类,希望能先通过降维之后再分类(直接分肯定也能分开)。那么我们需要将二维的数据(每个点包含横坐标和纵坐标,是二维的)降维到一维直线上的点。  我们可以有多种降维的策略,通过将二维平面上的点映射到一维直线上,如上图所示就是两种映射方法:左边是投影到向量u1u_1上,右边是投影到向量u2u_2上。显然左边的投影能让数据分的更加散,能更

2017-12-31 21:55:14 935

原创 EM算法

首先感谢高佩旭同学的PPT,很怀念以前一起学习数据挖掘十大算法的时光。1.问题引入一般情况:  假设我们遇到这样一个问题:我们需要调查我们学校的男生和女生的身高分布。采取抽样调查的方法,在校园里随便选取100个男生和100个女生,共200个人(也就是200个身高的样本数据)。  为了方便分类统计,我们可以将他们带进一个教室,然后让男生站到左边,女生站到右边。这样就可以先统计抽样得到的100个男生的身

2017-12-29 22:26:10 472

原创 前向传播算法和反向传播算法

最近在看神经网络中的前向传播算法(FP)和反向传播算法(BP),特地进行总结一下,方便以后理解。1.基本概念  上图是一张自己画的神经网络的图。假设每一层都添加了偏度单元(即值为1的神经元),用来表示阀值(因为阀值通常是一个常数)。  上图中{x1,x2,x3}\{x_1,x_2,x_3\}表示输入(假设其中添加了偏度单元,后面不再重复),wij(k)wij(k)表示联结权重,其中ii表示每次输入中

2017-12-28 22:22:55 10485 2

原创 Python中list(列表)

Python中常见的序列(Sequence)类型有三种:list,tuple, range。这里讲解list,即列表。list中大多数方法继承自Sequence中,仅仅少数几个自己的方法,如sort(),用来排序。list可以通过以下几种方法进行构造。 *用一对空的方括号来定义空列表,例如 uses = [] *使用方括号,用逗号分开元素。例如:[a], [a, b, c] *方括

2017-12-27 16:19:53 5325

原创 关联性挖掘--Apriori算法详解

首先,要感谢谭武和张朋博同学的PPT,怀念以前一起学习数据挖掘十大算法的时光!1.关联挖掘例子啤酒和尿布的故事:   在一家超市中,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的销量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下

2017-12-26 11:37:00 2187 5

原创 朴素贝叶斯详解

朴素贝叶斯分类是一种十分简单的分类算法,它的核心思想就是:求解某样本在此特征组合情况下属于各个类别的概率,哪个类别对应的概率最大,就猜测属于该类别。举个例子,当你看到今天的温度,湿度和空气状况,判断今天属于春天还是冬天;假如你在北京,今天气温5度,干燥,轻度雾霾,那么你就很可能觉得今天应该是冬天了;就是根据一组特征值来判断属于哪种类别的概率大。其数学定义如下:  假设类别集合为C={c1,c2,..

2017-12-25 15:37:53 3578

原创 决策树详解

1.引例  首先来看一个例子,这个例子是关于相亲的: 相亲的时候,我们通过比较一个一个的条件,来判断到底去不去见相亲对象,这种通过树状结构的判断就是典型的决策树。2.决策树  决策树是一种树型结构,有节点和有向边组成。节点: 内部节点:表示某一个属性或特征 叶结点:代表一种类别有向边/分支: 代表一个测试输出基本思想:采用自顶向下的递归方法,以信息熵(或其他度量条件)为度量

2017-12-24 12:13:09 2444

原创 scikit-learn中随机森林使用详解

最近学了一下随机森林,本来想自己总结一下,但是觉得有一篇已经很好的博客,就给大家分享,我主要讲讲scikit-learn中如何使用随机森林算法。  scikit-learn中和随机森林算法相关的类为RangeForestClassifier,相关官方文档讲解点击这里,这个类的主要参数和方法如下:类的构造函数为:RandomForestClassifier(n_estimators=10,criter

2017-12-23 22:37:23 11899 2

原创 tkinter # If this fails your Python may not be configured for Tk解决方法

今天在Python中画图,用的是matplot,结果执行的时候出现这个错误。  tkinter其实是Python调用tcl程序的标准Python程序,可以通过这个interface调用tcl的程序,因为在大多数的unix系统中都内置了很多的tcl程序和命令。  Tcl 是“工具控制语言(Tool Command Language)”的缩写,其面向对象为otcl语言。Tk 是 Tcl“图形工

2017-12-21 16:38:43 20203 7

原创 tomcat启动关闭两种方法

1.普通方法直接用start.sh来启动tomcat,用shutdown.sh来关闭tomcat。缺点是遇到错误会闪退,无法追踪错误。2.catalina方法在cmd中进入catalina.sh所在目录,然后使用如下命令:catalina start来启动tomcat,如果遇到错误,会提示是什么错误导致无法启动,不会直接闪退。同理,关闭tomcat用如下命令:catalina stop

2017-10-30 10:05:30 18437

原创 leetcode5:最长回文子串

这个题目主要是运用manacher算法,又称为马拉车算法,下面对算法进行介绍。manacher算法  首先,定义一些变量,假设当前访问的是第ii个位置:     1.p[i]:1.p[i]:表示已第ii个字符为中心的最长回文子串的半径。     2.maxRight:i2.maxRight:i之前(包括ii)所对应的回文子串所能到达的最右边的位置。  然后假设现在要求以第j(假设j=i+k)j(

2017-10-28 14:18:53 316

原创 markdown数学公式手册

这几天写博客,需要写一些数学公式,在百度上找了半天关于markdown数学公式手册,都没有找到,好不容易在google上找到,这里分享给大家,好用记得点赞哦!!! 手册链接:https://www.zybuluo.com/codeep/note/163962

2017-10-27 16:04:44 477

原创 支持向量机(SVM)推导

1.svm定义  SVM从线性可分情况下的最优分类面发展而来 。最优分类面就是要求分类线不但能将两类正确分开( 训练错误率为0),且使分类间隔最大。SVM 考虑寻找一个满足分类要求的超平面,并且使训练集中的点距离分类面尽可能的远,也就是寻找一个分类面 使它两侧的空白区域(Margin) 最大 。如下图所示: 左边是一个分类超平面,但是不是最佳的,显然右边的分类超平面是最佳的,我们的目标就是要找

2017-10-26 17:29:38 407

ODBC连接mysql

MFC中ODBC连接数据库,有具体的步骤和方法,以及对数据库进行简单的插入,查询等操作

2014-11-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除