自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (4)
  • 收藏
  • 关注

原创 机器翻译Reranking和MERT的几点疑问

1. Och提出的MERT, 其论文和很多博主都说需要不断重复重复 “解码->n-best list-> weight tuning  ”的过程,但是只是使用了rescore后 n-best  list中得分最高的一个假设。调整了权重之后,为什么要重新解码呢? 语言中的singleton:翻译做“单件”,即只出现过一次的ngram

2014-03-13 18:35:20 1701

翻译 束搜索算法(Andrew Jungwirth 初稿)BEAM Search

·最近搜了几篇束搜索的文章,这篇最直白易懂,并有示例的详细步骤图解,比维基百科的更为合适,因此拿在这里,供参考。原文链接:Beam Search Algorithm (Draft by Andrew Jungwirth)束搜索算法本文目标:1.演示了如何在存储有限的情况下进行类似的宽度优先的图搜索算法,即束搜索,使用启发式函数和限定的束宽度beam width .2.强调在搜索

2014-02-20 11:04:24 11959

原创 自然语言处理 学习收藏网站_ 个人

记录一些遇到好的资源网站,个人之用,随时补充:机器翻译:http://www.statmt.org/机器翻译的论文,参考书,WMT2005-2013 的链接,相关工具包,语料,很全面的资源整合。

2014-02-18 20:19:36 964

转载 Eclipse 快捷键

Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对

2014-01-07 14:18:16 626

原创 借一篇论文了解重要性采样

最近看了EMNLP2013上的一篇论文,Yang Y, Eisenstein J. A log-linear model for unsupervised text normalization[C]//Proc. of EMNLP. 2013.文中用序贯蒙特卡洛SMC or PF(Particle filter )的方法,利用序贯重要性采样Sequenctial Importance Samp

2014-01-03 19:11:16 5217

原创 jama 矩阵运算速度

最近写的一个程序设计矩阵与向量的乘法,跑起来特别慢,因此利用jama包来提高运算速度,对比了一下矩阵相乘的速度:jama 表示jama的运算速度,for表示最原始的for循环处理的速度:matix元素的值是(-3,3)之间的一个浮点型随机数:matrix size500*5001000*10002000*20003000*3000ja

2014-01-03 11:18:51 1375 1

转载 java和C中exp 指数和对数函数的快速实现

1: java的实现 转载于:http://martin.ankerl.com/2007/02/11/optimized-exponential-functions-for-java/Usually microoptimization is only done in C or C++, but it works quite well in Java too. For a project I

2013-12-18 13:08:48 3773

原创 QTCreater 调试入门问题

F1                         查看帮助F2                         跳转到函数定义(和Ctrl+鼠标左键一样的效果)Shift+F2                声明和定义之间切换F4                         头文件和源文件之间切换Ctrl+1                   欢迎模式Ctrl+2

2013-11-21 14:40:22 1280 1

原创 Ubuntu12 64位 SRILM 环境搭建 _from sratch

1. 安装依赖软件时 出现:E: Problem with MergeList /var/lib/apt/lists/cn.archive.ubuntu.com_ubuntu_dists_dapper_multiverse_binary-i386_Packages E: 无法解析或打开软件包的列表或是状态文件解决办法:sudo rm /var/lib/apt/lists

2013-11-06 15:25:06 1236

原创 Google word2vec 模型和代码解析 之 前扑

一会儿再写

2013-11-04 20:35:50 2549

原创 64位 win7下nltk 环境搭建

之前重装了系统,nltk 要求重装,64位和32位混杂的时代,有些琐事还挺耗时呀!安装过程中遇到一些问题,记录备案一下:问题:1. win7 64位 python2.7 安装后 IDLE 无法启动2. win7 64位 nltk 安装3. Win7 64位 python  easy_install 的安装1.根据官网建议,下载Python2.7.3  http:

2013-11-04 11:20:23 2247

原创 java解析xlsx和docx 文件

用PIO包解析office2007 的excel 和word文档,需要的jar包 有:pio.jar:  http://poi.apache.org/download.htmldomj4.jar: http://www.java2s.com/Code/Jar/d/Downloaddom4jjar.htmxmlbeans-2.3.0.jar: http://www.jarfind

2013-07-02 21:37:27 2595 1

原创 两个任意阶阶乘数比较大小

描述:n!表示n的阶乘, n!!表示(n!)!,现在需要写一个方法比较两个任意阶数的数的大小,输入以字符串形式给出,例如:比较 6!!!! 和 48!!算法描述:1.先对输入进行归一化,即同时除掉相同的阶数,比较剩余部分的大小,比如:先将以上参数化简为: 6! !和48 比较大小;2.设化简后无阶乘符的数为simpleNum, 上例中simpleNum=48;含阶乘的数为 co

2013-04-17 20:53:40 1976

原创 Dijestra 最短路的java实现

问题描述:题目描述: 已知一个无向图G=(V,E),G 中任意两个顶点 u 、v 之间存在路径或者不存在路径,如果存在,则会有一个或者多个最短路径。给出两个顶点 u0 和v0,请用一种效率尽可能高的算法求u0和v0之间的所有的最短路径。 输入: 第1 行:图的顶点数 1<=N<10 和边数 1<=M<=N*(N-1)/2 ,第 2...M+1行:图中的边(u,v ,w),其

2013-04-16 01:17:16 1036

原创 Eclipse下第一个Servet 创建过程

1.搭建环境Win7x64的PC上已有:Elipse,JDK,Tomcat,即java和tomcat的运行环境已搭建好,环境变量也搞定了。在此基础上:下载 tomcat插件。http://www.eclipsetotale.com/tomcatPlugin.html#A3将zip文件解压,将解压后的文件夹拷贝到Elipse/plugin目录下。重启Eclipse,这时就可以看到

2013-03-16 17:57:52 846

原创 Python append与expand 区别

append()  与expand()区别:分别尝试以下方法,结果如下:mylist=[1,2,[3,4]]       >>>[1,2,[3,4]]mylist.append(5)    >>>[1, 2, [3, 4], 5]mylist.append([5])   >>>[1, 2, [3, 4], [5]]mylist.append([5,6])   >>>[1, 2,

2013-03-09 18:57:06 14555 2

原创 Python 字典 元祖 链表 常用方法 及概念区别

Python字典方法:常用的方法与字典相关习惯用法示例说明d={}创建一个空的字典,并将分配给dd[key]=walue分配一个值给一个给定的字典键d.keys()字典的键的链表list(d)字典的键的链表s

2013-03-09 18:38:11 1127

原创 聊天机器人Eliza 代码

Eliza是基于正则表达式替换的聊天软件,实现非常简单,以下是其Python代码:from util import reflectionspairs = ( (r'I need (.*)', ( "Why do you need %1?", "Would it really help you to get %1?", "Are you sure you ne

2013-03-02 21:54:53 4002

原创 与Eliza的第一次谈话

Eliza是个心理医师,60年代出生于MIT。以下是我们的第一次聊天:(>表示我的回答,其他为Eliza的话)Hello. How are you feeling today?>Not that bad,how are you?Why do you ask that?>well.Out of polite.How do you feel when you say that?

2013-01-31 21:00:46 1325

原创 逆序数求解

问题描述:对于n个数的一个排列排,A1,A2,……,Ak ,Aj,……An.如果存在k但Ak> Aj ,则称有一个逆序对存在,如  2 6 3 4 5 1,则有逆序(2,1),(6,3),(6,4),(6,5),(6,1),(3,1),(4,1),(5,1),逆序数为8.设计算法,对给定排序求解逆序数。设计思想:用二分法求解,将A分为两部分,AL和AH。分别求解两个的逆序数

2013-01-15 01:09:18 759

原创 SQL Server触发器 练习曲 股票标的插入数据表

目标:StockBid(stock_id, cust_id, flag, date, price, amount), 存储股票买入和卖出的标的,分别代表股票号,客户号,flag用来标识是买入还是卖出,标的日期,标的价格,以及标的数量。实现一个触发器,每当插入一条记录,检查是否可以成交,成交的条件是买入价大于等于卖出价,并且最老的标的优先成交。成交时如果一方(A)的标的数量小于另一方(B),

2012-12-15 03:37:11 662

A log-Linear Model for Unsupervised Text Normalization阅读笔记

A log-Linear Model for Unsupervised Text Normalization文档的阅读笔记,借以理解重要性采样、序贯重要性采样

2014-01-03

Deep learning via Hessian-free optimization

Martens 提出的改进的Hessian Free 优化方法,相比传统BP使用范围更广,现在在RNN的训练中效果很好

2013-11-22

lucene in ation

完整版,pdf 界面清晰。 lucene学习必备

2013-04-17

Dijestra最短路 java实现

java 实现 并未对代码作什么整理,也未对算法优化,仅供参考

2013-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除