自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

codinglee

留下爬过的脚印,待我故地重游,去收获那无意播种所结出的甜美果实

  • 博客(22)
  • 资源 (15)
  • 收藏
  • 关注

原创 语义角色标注

简介语义角色是指论元在动词所指事件中担任的角色。主要有施事agent、受事patient、客体theme、经验者experiencer、受益者beneficiary、工具instrument、处所location、目标goal和来源source。这篇论文主要处理在PropBank中的语义角色标注问题,其中的语义角色包括以下:ARG0、ARG1、ARG2、ARG3、ARG4ARGM

2018-02-03 13:57:35 9008 5

原创 StandFord的parser的调用API

注意Parser针对已分好词的中文句子生成语义生成树。Parser下载地址https://nlp.stanford.edu/software/lex-parser.shtmlAPI(Java)将Jar包导入到项目后在Java程序中import一下import java.util.ArrayList;import java.util.Collection;im

2018-02-03 13:44:58 774

原创 磁盘调度算法

先来先服务(FCFS)最短寻找时间优先(SSTF)会存在“饥饿”现象扫描(SCAN)又称为电梯算法,它不利于远离磁头端的访问。循环扫描(C-SCAN)利用磁头复位较快,它消除了SCAN对两端磁道请求的不公。

2016-12-29 20:43:15 605

原创 页面置换算法

最佳置换算法(OPT)最长时间内不再被访问的页面(无法实现)先进先出(FIFO)会出现Belady异常:当分配的物理块数增大,而页面故障数反而增大。最近最久未使用(LRU)需要寄存器和栈的硬件支持。时钟(Clock)即最近为使用(NRU)改进型Clock置换算法置换次序为:未访问过且未修改,未访问但修改了,访问了且未修改,访问了且修改了。(在置换时,才将修改过的内容写回,这样节省了时间开销)

2016-12-29 20:39:25 555

原创 进程调度的典型算法

先来先服务(FCFS)对于长作业比较有利,但对短作业不利(相对SJF和高响应比)。有利于CPU繁忙型作业,而不利于I/O繁忙型作业。短作业优先(SJF)平均等待、周转时间最少,但对长作业不利(会出现“饥饿”现象)优先级静态优先级、动态优先级相应比优先相应比 = (等待时间+要求服务)/要求服务它克服了“饥饿”状态,兼顾了长作业时间片轮转时间片影响因素:系统响应时间、就绪进程中队列数目、系统处理能力适

2016-12-29 20:33:27 433

原创 动态分区的分配策略

首次适应(FirstFit)算法按地址地址递增的次序链接,找第一个满足要求的空闲分区。最佳适应(BestFit)算法按容量递增形成分区链,找第一个满足要求的分区最坏适应(WorstFit)算法按容量递减,找最大满足要求的空闲分区邻近适应(NextFit)算法循环首次适应算法,从上次查找结束为止开始继续查找。

2016-12-29 20:26:23 992

原创 改进的模式匹配算法——KMP算法

目录目录概述next数组求解算法KMP算法概述KMP算法可以在O(n+m)的时间数量级上完成串的模式匹配操作。其改进在于:每当一趟匹配过程中出现字符比较不等时,不需回溯i指针,而是利用已经得到的“部分匹配”的结果将模式向右“滑动”尽可能远的一段距离后,继续进行比较。这里我假设你已经知道有next数组的存在了,那么,next数组的实质是什么呢?next数组实质上就是:每个位置找到最长的公共前缀。

2016-12-29 20:14:06 3928 1

原创 最短路径

目录目录概述Dijkstra算法求单源最短路径问题Floyd算法求各顶点之间最短路径问题概述若图时带权图,则把从一个定点v0到图中其余任何一个顶点vi的一条路径(可能不止一条)上所经过边上的权值之和定义为该路径上的带权路径长度,把带权路径长度最短的那条路径也称为最短路径。求解最短路径的算法通常都依赖于一种性质,也就是两点之间的最短路径也包含路径上其他顶点间的最短路径。带权有向图G的最短路径问题

2016-12-29 20:00:13 4323 1

原创 最小生成树(Minimum-Spanning-Tree, MST)

目录目录概述普里姆Prim算法克鲁斯卡尔Kruskal算法概述一个连通图的生成树是图的极小联通子图,它包含图中所有顶点,并且只含尽可能少的边。这意味着对于生成树来说,若砍去一条边,就会使生成树变成非连通图;若增加一条边,就会形成图中的一条回路。对于一个带权连通无向图G=(V,E),生成树不同,每棵树的权(即树中所有边上的权值之和)也可能不同。社R为G的所有生成树的集合,若T为R中权值之和最小的

2016-12-29 15:42:33 3681 1

原创 树、森林转化为二叉树

目录目录树转换为二叉树的画法森林转换为二叉树的画法树转换为二叉树的画法1.在兄弟节点之间加一连线;2.对每一个节点,只保留它与第一个子节点的连线,与其他自己节点的连线全部抹掉;3.以树根为轴心,顺时针旋转45度。森林转换为二叉树的画法1.将森林中的没课树转换成相应的二叉树;2.将每棵树的根相连;3.以第一棵树的根为轴心顺时针旋转45度。

2016-12-29 12:12:34 6894 2

原创 二叉树后序遍历的非递归实现

目录目录算法思想算法实现算法思想因为后序非递归遍历二叉树的顺序是先访问左子树,再访问右子树,最后访问根节点。当用堆栈来存储节点,必须分清返回根节点时,是从左子树返回的,还从右子树返回的。所以,使用辅助指针r,其指向最近访问过的节点。也可以在节点中增加一个标志域,记录是否已被访问。算法实现//strcut TreeNode {// ElemType data;// TreeNode *le

2016-12-29 11:08:43 24548 13

原创 线索二叉树

线索二叉树概念遍历二叉树就是以一定规则将二叉树中的节点排列成一个线性序列,从而得到二叉树节点的各种遍历序列。其实质就是对一个非线性序列进行线性化操作,使得在这个访问序列中每一个节点(除第一个和最后一个)都有一个直接前驱和直接后继。传统链式存储能体现父子关系,不能直接得到节点在遍历中的前驱和后继。通过观察,我们发现在二叉树表示的二叉树中存在大量的空指针,若利用这些空链域指向其直接前驱或直接后继的指针,

2016-12-29 10:50:01 2005

原创 常用泰勒公式

在x=0处的泰勒展开(佩亚诺(Peano)余项)

2016-12-29 09:21:19 20594

原创 Storm JAVA_HOME is incorrectly set

windows安装storm的过程比较简单,但是过程中可能会遇到环境变量等配置上的坑。于是我遇到,特此记录。Windows上安装storm教程:点这里我安装好了所需版本的jdk,安装运行ZooKeeper,安装Storm。然后按照教程配好环境,开始运行storm时发现出问题了。无论在storm目录下输入命令“storm nimbus”、“storm supervisor”、“storm ui”中的任

2016-07-15 11:20:56 1609

原创 位运算(C/C++)

位运算的使用过程中有一些细节没注意就被坑了,于是记下备忘。主要的位运算是:‘>>’, ‘<<’, ‘^’, ‘&’, ‘|’移位运算:左移(‘<<’),右移(‘>>’)uint16_t a = 0x00FF;uint16_t b = a << 8;uint16_t c = a >> 8;cout << hex << a << endl;cout << hex << b << endl;

2016-07-09 23:19:26 942

原创 uint8_t、uint16_t、uint32_t、uint64_t、size_t、ssize_t、

我们经常创建C/C++项目中的程序是32位的控制台程序。所以,此处是针对32位的控制台程序(一般都是32位):typedef unsigned char uint8_t;typedef signed char int8_t;typedef unsigned short uint16_t;typedef signed short int16_t;typedef unsigned int uint3

2016-07-09 14:04:01 1719

原创 对结构体vector进行sort(C++)

自己写一个小程序时,自己定了一个结构体word,并使用了C++标准库中的vector来作为结构体word的容器。我在程序需要对所有的word进行排序。于是,问题来了:如何对结构体vector,使用标准库中vector封装好sort()来排序呢?主要有两种方法: 1. 结构体内部:对‘>’和‘<’进行重构; 2. 另外编写比较函数:bool cmp(const void s1, const voi

2016-06-22 10:21:25 9290

原创 Python main的命令行参数:sys.argv

自己写了一个功能函数方便自己使用,突然意识到需要用到sys.argv来传参,于是记录一下。python使用sys.argv来传参。例如:我自己写了一个字符替换的python程序replace.py。# -*- coding:utf-8 -*-import sysclass replace: def __init__(self, argv): '''

2016-06-13 21:17:44 12250

原创 My Chief My Regiment(最后续语)

二十四岁的时候,我在这里打了一场博命的战斗。命令说只坚守两天,可我们却守了三十八天,三十八天头上我睡着了,这一觉睡了六十年 现如今己八十四岁了 我把自己留在了这里,留在了南天门。年轻的时候我拼命地跑啊,逃啊!是为了回到我的故乡 那个当年叫做北平的地方。今天我老了,我把自己的余生交给了这里 是为了在这里一抬头就能看见我的南天门。我应该感谢你啊!南天门 在我垂老的记

2016-05-30 11:29:44 906

原创 通过免安装版(安装文件)安装Mysql5.7

自己在安装过程中遇到一些问题,解决过程中,发现一些坑爹的地方:新版mysql有的没有data目录需要自行添加并初始化。写此博客,仅告知自己以后如果再安装mysql要注意这些问题。1.下载mysql5.7(下载地址)的安装文件:是安装好的文件夹,而不是安装程序。2.下载后压缩文件解压,放到自己想放的地方。我是解压发到D盘,对应的路径是:D:\mysql;3.在D:\mysql目录新建“my.ini”文

2016-05-17 22:16:22 4888

原创 Python:文件操作

Python的文件操作较为简单,但是容易忘掉,然后自己就得去查询。然而,有时查到的还并不是自己需要的,这样一来就会比较耗时。所以,自己决定写一个备忘再此,需要时回来看看即可。详细介绍在这里:PythonFile对于Python的文件操作,我们主要是了解它的:1.文件操作模式、2.常用方法、3.文件夹的创建 [TOC]文件操作模式 Mode 功能 r 以读方式打开 w 以写方式

2016-05-17 16:12:11 531

原创 Python正则表达式

字符串匹配方法正则表达式:RE因为在自己在编写网络爬虫过程中,用到了正则表达式,感受到了它的优雅!为了方便用时能够记起一些重要的使用方式,所以,在此记下。详细介绍在这里:点击查看对于正则表达式(RE:Regular Expression),我们主要是了解它的:1.常用符号、2.常用方法、3.常用搭配一RE的常用字符二RE的常用方法三常用搭配(一)RE的常用字符 Symbol 含义

2016-05-17 15:36:36 5654

频繁项挖掘

自己手动实现了FPTree进行频繁项挖掘,同时通过实际的应用来加深对于频繁项挖掘的理解的和认识。文件中包含说明文档,以及项目文件(VS2017 C++,Python 2.10 rake_nltk)。代码风格较为轻快。

2018-02-03

MultiBoosting Iterative Bagging

MultiBoosting、Iterative Bagging的python实现,代码通俗易懂。

2018-02-03

C++实现带括号正整数加减乘除的计算器(代码中提供了测试用例)

描述 编写一个程序可以完成基本的带括号的四则运算。其中除法(/)是整除,并且在负数除法时向0取整。(C/C++/Java默认的除法就是向0取整,python默认的是向负无穷取整。) 例如计算 100 * ( 2 + 12 ) - (20 / 3) * 2, 结果是1388。 输入 一个长度不超过100的字符串,代表要计算的算式。包含数字0-9以及+-*/()。 输入保证计算过程不会超过32位有符号整数,并且其中的'-'都是减号没有负号。

2017-09-29

北京大学研究生新生校纪校规考试答案_2017

2017北京大学研究生新生校纪校规考试部分答案,再结合北京大学给的参考资料。就可以轻松通过ctrl + c 和 ctrl + v查找到了。

2017-08-21

B树、B+树的C++实现

B树、B+树的C++实现

2017-07-05

eigen_3.1.2.tar.bz2/gperftools-2.0.tar.gz/libevent-2.0.18-stable.tar.gz

graphLab安装过程中,我们第一次make编译初始化时,linux下的部分文件无法自动下载。会提示“---downloading... src = 'http://tcpdiag.dl.sourceforge.net/project/boost/boost/1.53.0/boost_1_53.... dst = '/home/lee/graphlab/deps/boost/src/boost_1_53_0.tar.gz' CMake Error at boost -stamp/download-boost.cmake:6(file):”。大概需要的文件有boost_1_53_0.tar.gz/eigen_3.1.2.tar.bz2/gperftools-2.0.tar.gz/libevent-2.0.18-stable.tar.gz。其中的boost_1_53_0.tar.gz比较容易找到,所以这里就分享我遇到的需要自己下载手动添加到文件夹的文件。

2016-07-12

Pascal语义分析器

紧接我之前提交的Pascal词法和语法分析器,这里是实现了赋值、if-语句、for-语句的Pascal语法制导的翻译的语义分析器。

2016-06-12

哈工大数据库实验

16哈工大数据库全5个实验代码实现,代码通俗易懂。其中实现的程序语言包括:python(PyQt)、c++

2016-06-12

C++实现缓冲区的类

通过C++实现了缓冲区的类,模拟真实缓冲区的数据处理和传输过程。

2016-05-17

UDP&TCP在windows下基于winsock的数据传输实现

windows下的基于winsock的socket编程,实现了UDP和TCP的数据传输,其中的TCP的实现自然也包括TCP协议中的Server和Client建立连接的过程。代码易懂。

2016-05-17

HTTP代理服务器,windows下socket编程

windows下的基于winsock的socket编程,实现的一个简易的HTTP代理服务器。

2016-05-17

Pacal语法分析

编译原理课的Pacal语法分析器,通过编译工作台获得的LR0表,然后通过总控程序完成:移进、规约等操作。代码格式较为轻松,易懂。

2016-05-17

Pacal词法分析器

针对Pacal编写的c的词法分析器,简单的实现,代码格式易懂。

2016-05-17

打渔还是晒网的代码

中国有句俗语叫“三天打鱼两天晒网”。某人从1990年1月1日起开始“三天打鱼两天晒网”,问这个人在以后的某一天中是“打鱼”还是“晒网”。根据题意可以将解题过程分为三步:1)计算从1990年1月1日开始至指定日期共有多少天…… 中国有句俗语叫“三天打鱼两天晒网”。某人从1990年1月1日起开始“三天打鱼两天晒网”,问这个人在以后的某一天中是“打鱼”还是“晒网”。

2015-02-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除