- 博客(9)
- 资源 (19)
- 收藏
- 关注
原创 一些实用的语义角色标注(SRL)工具使用方法
不懂SRL的自己去扫盲吧,简言之就是predict-argument分析。找了一些工具,其中暂时调通两个1. swirlhttp://sourceforge.net/projects/swirl-parser/,可以从这下载,本工具里readme介绍较详细,主要是注意有多种输入格式。带有名实体标注的可能效果比较好,什么都没有的效果比较差一点,下面就简单说一下什么都没有的输入格式。格
2013-04-24 10:29:35 7186 15
原创 利用svmrank实现ensemble learning的方法研究
机器学习分类过程中,如果遇到多个分类器表现差不多,想综合各个分类器的优势时,可以考虑多分类器投票,即VOTING的方法,也可以考虑learning to rank的方法优选偏重于正确分类标签的预测得分组合。下面简单总结一下使用svmrank进行集成学习的方法。首先把数据分为训练集、验证集、测试集,然后都进行特征提取和量化训练集(training):原始数据,每一列都是特征,用来提取
2013-04-20 15:52:43 2199 5
转载 释放linux驻留内存方法
看过一些链接,记录一下。执行完许多指令或程序后,本来很大的系统内存就木有了,这时候需要手动释放。1. 查看cat /proc/sys/vm/drop_caches默认是02.执行sync把未写的系统缓存写入磁盘3.执行echo 3 > /proc/sys/vm/drop_caches好了,用free -m查查吧
2013-03-14 14:41:53 1048
原创 使用SRILM为大文件构建语言模型
文件:英文wikipedia article,预处理后大小11G系统:SUSE x64,128G内存任务:针对该数据集建立语言模型SRILM的安装和配置就不再赘述了,百度,52nlp,或者SRILM官网都很详细,根据自己机器来配置即可。贴个百度的吧http://hi.baidu.com/keyever/item/8fad8918b90b8e6b3f87ce87下面讲
2013-03-14 11:01:16 2010
原创 英文NLP工具包推荐
最近研究英文NLP,用到些许工具包,在此记录,免得遗忘。也希望前辈同僚们指点推荐。基本的流程是从surface开始,到浅层语义结束1. 词义词典wordnet,提供英文单词的词义、同义反义、词源等,安装配置详见http://blog.csdn.net/ilovewindseed/article/details/81476132. 语义组块分析(Chunk)CRFChun
2012-12-12 09:36:23 1378
原创 RST Annotation Tool
偶然间看到的一个段落级句间关系分析工具,英文的,先mark一下。地址http://www.isi.edu/licensed-sw/RSTTool/可以分析段落里面各个句子之间的关系,网站给出的示例如图:看起来不错,还没用过,先mark一下!还有一个据称是state-of-art的text level parser唤作HILDA parser。不过online demo暂时失效,
2012-11-24 21:37:08 1038 1
原创 linux版wordnet安装和使用[fc13]
wordnet3.0.tar.gz 使用的是conll评测提供的版本,地址如下:http://conll.cemantix.org/2011/download/WordNet-3.0.tar.gz楼主为了安装wn3.0在实验室的fedora13机器上,遇到了一些问题,网上资料也少,最后终于安装成功,也算费尽周折,希望在此提供有益信息,减少同仁们今后的麻烦!安装步骤:1.
2012-11-06 10:53:46 1955
原创 C++利用vector实现随机选N项
利用stl中的vector实现随机选择N个数字里的N项,主要使用中的random_shuffle函数,函数格式是random_shuffle(vector.begin(), vector.end())。举例:srand(unsigned(time(NULL)));vector randomVec;for(int i = 0; i < 100; ++i){ rando
2012-11-05 18:49:04 8315
原创 stanford parser使用参数
上次使用stanford parser解析conll shared task中英文句子的时候,就遇到了句子被其中的分隔符“.”分成两句的情况,上次没有解决。现在回头做实验,才查到可以指定参数,告诉parser按照每一行来切分句子。官网的FAQ上原句是If you want to give the parser one sentence per line, include the option
2012-11-04 16:03:39 966
机器学习经典书籍Machine learning - A Probabilistic Perspective
2013-11-15
很好的维基百科介绍和研究综述
2013-09-03
Tom Mitchell的机器学习(中文清晰版)
2013-08-07
svmrank和ranklib中提到的example3
2013-03-28
Pattern Recognition And Machine Learning
2012-12-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人