自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(125)
  • 资源 (6)
  • 收藏
  • 关注

IT宅来解答所谓的12306的售票所谓库存算法难题

【引言】 在天涯上看到有人发帖,也在Iteye上看到相同论调,本人对某些人所谓的“库存”难题的思路不以为然,对此,鄙人给出个算法模型,献丑,只为打某些人的脸!一下是iteye上一篇文章提出的问题[quote]好了,讲了这半天淘宝,可以说12306了吧?我以北京西到深圳北的G71次高铁为例(这里只考虑南下的方向,不考虑深圳北到北京西的,那是另外一个车次,叫G72),它有17个站(...

2014-01-14 20:31:15 968 3

来自开源支持者的第一笔捐赠

2013年1月9号,一个平凡而又不平常的日子!IK中文分词开源项目在历经六个年头的发展,迈入第七个年头时,迎来的它的第一笔捐赠!感谢来自广州的热心支持者Andy!!!作为一名开源项目的个人用户及捐赠者,您的慷慨善举对于IK,甚至对于广大的国内开源项目的发起者而言,都是莫大的肯定与鼓舞!!笔者本人并不清楚国内(个人发起的)开源项目中有多少是已经得到捐赠的。国内的开源用...

2013-01-09 21:15:24 154

发布 IK Analyzer 2012 FF 版本

首先感谢大家对IK分词器的关注。最近一段时间正式公司事务最忙碌的时候,Lucene4.0和Solr4.0发布后,便收到了广大网友的大量邮件要求更新版本,这让我既开心又感到鸭梨大啊~~花了3天时间,了解了Lucene4.0和solr 4.0与分词相关部分的源码。果然,又是一次不兼容的修订啊~~时间紧迫的推出了IK Analyzer 2012 FF版本 (你问啥是FF,其实就是...

2012-10-23 17:50:33 240

原创 发布 IK Analyzer 2012 版本

[size=large][b]新版本改进:[/b][/size][list][*]支持分词歧义处理[*]支持数量词合并[*]词典支持中英文混合词语,如:Hold住[/list][size=large][b]IK Analyzer 2012特性[/b][/size][list][*]采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式;...

2012-03-08 11:23:41 173

CSDN发生严重用户账号泄密事件

之前有在CSDN注册过的兄弟们,注意了。。。如果你的邮箱,以及其他账户用的密码和CSDN上的一致,请赶快修改!!看到新闻的兄弟们帮顶了....新闻地址 : http://tieba.baidu.com/f?kz=1332938478...

2011-12-21 19:21:09 498

向各位兄弟姐妹们“轰烧”一下搜狐福州的环境

第一眼看着相当给力,不敢说跟国际大公司比,不过在福州这个小地方还是不错滴~~关键在于办公氛围比一般的企业来的轻松,惬意啊!废话不多说,上图咯~~~~~~~~~~~[size=x-large][b]进门第一眼[/b][/size][img]http://linliangyi2007.iteye.com/upload/picture/pic/100341/dd1808e6-...

2011-10-11 15:47:49 125

一个隐形的java int溢出

[b]故事的背景:[/b] 笔者最近在做一个类SNS的项目,其中使用了MongoDB进行Feed信息存储,并使用定时器删除过期信息。 定时器的时间变量为60天,设定[code="java"] private long msgInvalidDue = 60 * 24 * 3600 * 1000;[/code]之所以这么写常量,完全是为了代...

2011-08-30 09:44:53 97

原创 雷军 :互联网创业的葵花宝典

[b]博主评: 这片博客很短,很给力,转载过来,作为收藏 :D [/b]一个朋友,在一家软件的大企业做了十年的软件研发,想出来创业,问我要注意什么。我开玩笑说,要想成功,必须学习互联网创业的“葵花宝典”,第一条就是“挥刀自宫”。大的软件公司有很多资源,研发能力不错,各种推广资源也非常优越,但很少开发出来优秀的互联网产品。初步看上去,原因很多,比如很难调动个人的积极性、内部管理协调非...

2011-05-04 10:35:20 123

Luci-mint站内搜索实测

[b][url=http://linliangyi2007.iteye.com/blog/948189]关于Luci-mint[/url][/b][size=large][b]服务器硬件环境[/b][/size][color=blue]目前搜索中心仅使用一台PC Server[/color]CPU Intel(R) Xeon(R) CPU E5520 (4核 8线程 、8M Ca...

2011-04-02 16:18:08 93

Google,Baidu,Sogou,SOSO哪个更牛(有图有真相)

各大搜索引擎产商都鼓吹自己最理解中文,笔者做了个一个比较搞笑的测试,有图有真相,大家自己看吧,哈哈哈!谁能“读懂”中文,抽出其中的核心语义词,一目了然啊!拜google大神,顶sogou国产(还需努力)!谁敢说这个是软文,自己上网测试去,嘿嘿嘿! :wink: [img]http://linliangyi2007.iteye.com/upload/picture/pic/8...

2011-03-30 11:57:19 276

Windows7直接刻录ISO

笔者我在准备写这个议题的时候,其实觉得很可笑,这么简单的事对长年从事IT的人来说应该不难的,但是,确实落了笑话的~~听笔者慢慢道来(哈哈)故事背景:俺家MM要给她家的小表弟重装系统了,于是乎,向公司的网管考了份winXP ghost的iso文件,心想,本本有刻录功能,回家随时可以刻光盘,没当回事~~故事开始:这天晚上,MM说明天要去小表弟家了,于是开始刻录。插入空光盘,win7就提...

2011-03-29 22:15:00 99

原创 分享Lucene中文分词组件"IK Analyzer V3.2.8"

[b]IK Analyzer 3.X介绍[/b]     IK Analyzer是一个开源的,基于java诧言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.X则发展为面吐Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。[b]IK Analyzer 3.2.8特性[/b] 采用了特有

2011-03-11 10:51:00 913 1

原创 分享一个Lucene索引公用组件--LuciMint

[size=large][color=red]最新更新包V1.1.5已经发布[/color][/size][size=large][b]前言[/b][/size] 关于LuciMint的诞生, 笔者觉得有必要说明一下。首先它不是一个开源项目,而只是笔者在工作过程中,总结出的一个工具包,因此,第一,它暂时不开源(代码还处于优化修改期),第二,它的功能还是比较有限的。与Lucene相对比,...

2011-03-09 12:49:32 177

原创 发布 IK Analyzer 3.2.8 for Lucene3.X

[size=large][b]IK Analyzer 3.2.8版本修订[/b] [/size][list][*]1.优化了英文字符处理,支持如:C++ 等带符号单词输出[*]2.简化了数词处理,使输出结果更符合用户观感[*]3.改进了最大词长切分,使输出结果更符合用户观感[*]4.性能优化,目前IK分词器的速度为约85万字/秒(1600K字节/S)[*]5.新增IK简易查...

2011-03-04 17:49:39 425

原创 TIPS - XML CDATA中的非法字符处理

XML解析过程中,常遇见CDATA中存在非法字符,尤其在火星文盛行的当下,论坛数据五花八门,令哥蛋疼,采用如下简单处理:[code="java"]String EMPTY_STRING = "";public static String regularizeXmlString(String strInput){ if(strInput == null || strInput....

2011-02-17 15:03:10 218

庆祝IT民工的速度生活

[list][*]2010年9月28日,报名驾校[*]10月9日,第一堂驾驶培训[*]10月12日,科目一考试,99分[*]11月25日,科目二考试,100分[*]11月29日,科目三考试,100分,拿到驾照[/list]速度且给力...穆哈哈哈哈~~~~...

2010-11-29 10:57:49 86

原创 都是淫才啊~~~

[img]http://linliangyi2007.iteye.com/upload/picture/pic/75865/75aee304-1b10-3285-b0f2-eb6d59a1c121.jpg[/img]佩服!佩服! :idea:

2010-11-10 10:16:31 2989

原创 这个图可以搜藏,嘎嘎嘎

┏┓   ┏┓┏┛┻━━━┛┻┓┃       ┃  ┃   ━   ┃┃ ┳┛ ┗┳ ┃┃       ┃┃   ┻   ┃┃       ┃┗━┓   ┏━┛ ┃   ┃             ┃   ┃  ┃   ┗━━━┓  ┃       ┣┓  ┃       ┏┛  ┗┓┓┏━┳┓┏┛   ┃┫┫ ┃┫┫  ...

2010-10-23 23:08:42 269

对Cassandra的初体验

作为“云计算”时代的架构设计人员而言,不懂K-V库会被人说out的,为此,笔者在“人云已云”的忽悠下,也开始接触K-V数据库了。 在啥都不清楚的情况下,首先选择跟风,未必是一件坏事。尤其对技术人员而言,先入门再做选择,也不失为一种方法。“听说xxx大网站都是用Cassandra存储他们的SNS数据的,我们也要试试”,于是乎,开始了Casssandra初体验。[colo...

2010-10-13 17:58:55 167

Spring + iBatis 的多库横向切分简易解决思路

[size=large][b]1.引言[/b][/size] 笔者最近在做一个互联网的“类SNS”应用,应用中用户数量巨大(约4000万)左右,因此,简单的使用传统单一数据库存储肯定是不行的。 参考了业内广泛使用的分库分表,以及使用DAL数据访问层等的做法,笔者决定使用一种最简单的数据源路由选择方式来解决问题。 严格的说,目前的实现不能算是一个解决方案,只能是一种思...

2010-10-11 13:43:53 85

Gosling离开Oracle的原因让我感到Java程序员的一种无奈

看到了Gosling离开Oracle的真实原因,这应证了我先前的直觉,Java在Oracle的领导下,前途渺茫~~~更让我震惊的事,连Gosling这样级别的技术专家也有被轻视的时候,难道IT从业技术性人才都注定被轻视吗~~~...

2010-09-25 22:58:58 195

发布 IK Analyzer 3.2.5 稳定版 for Lucene3.0

[color=red]新版本IKAnnlyzer3.2.8已发布![/color]地址: [url]http://linliangyi2007.iteye.com/blog/941132[/url]IK Analyzer 3.2.5版本修订在3.2.3版本基础上,更新如下:1.修订了分词器内部的数组越界异常2.重构了字母子分词器,强化了对英文和阿拉伯混合字窜的切分...

2010-09-08 14:43:29 195

原创 ThinkPad C盘空间莫名丢失问题

今天突然发现ThinkPad C盘空间不足了,检查一下发现全盘文件(包括系统缓存、隐藏文件等)只占用22G,系统显示C盘占用60G,足足少了38G。最后发现是IBM的Rescue And Recover占用了,即便你没做系统备份,一样占用,卸载掉就好!!差点就重装系统了,那就杯具了,顺便bs一下怂恿我重装的家伙 :wink: ...

2010-06-13 12:27:28 222

关于Lucene3.0.1 QueryParser的一个错误

表达式1:[quote]id:"1231231" && title :"MYNAMEmonkey" && content:"你好吗" && ur:"sdfsdfs""[/quote] 四个条件的AND计算,在QueryParser解析为:[quote]+id:1231231 +title:mynamemonkey +content:"你

2010-05-21 21:33:22 78

发布 IK Analyzer 3.2.3 稳定版 for Lucene3.0

IK Analyzer 3.2.3版本修订 在3.2.0版本基础上,更新如下:1.优化词典匹配算法,将IK分词器速度提高至80万字/秒2.添加对韩文、日文的支持,采用单字切分3.增加IKQueryParser的 setMaxWordLength 方法,使其支持最大词长切分[color=red]PS:如果您使用的是Solr1.3或者v2.9之前的Lucene,请下载IK ...

2010-05-15 14:13:50 210

央视-新闻频道-天气预报背景音乐正解

发现那个背景音乐相当好听,很多网友在网上问这个问题,结果愣是有一群标题都不看清楚的小白说是“渔舟唱晚”,下载一听,是N年前的一套的天气预报的背景音乐,差点没把三天的饭都吐出来!!!!找到正解了,是Omar Akram 的 Run Away With Me。 Run Away With Me同名的不只一首哦,所以要认准作者,嘿嘿!!...

2010-03-15 09:13:53 230

新年新公司新生活

春节前再一次的跳槽了 :wink: ,感觉跟以往有太多的不同,也许因为婚了,也许因为而立之年,又或许是找到自己想要的东西了。现在还说不清,但人生本质就是一种体验,又何必说清呢,都说难得糊涂啊!...

2010-02-22 10:57:41 72

原创 windows平台上的nginx使用

转载自:[url]http://nginx.org/en/docs/windows.html[/url]nginx/Windows uses the native Win32 API (not the Cygwin emulation level). Currently only the select method is used as a notification way, there...

2010-01-28 17:13:05 89

发帖纪念,为了铭记1937年的今天12月13日

啥都不说了,上香,拜拜!

2009-12-13 23:46:16 76

发布IKAnnlyzer3.2.0稳定版 for Lucene3.0

[color=red]最新3.2.5版本已经推出,[url]http://linliangyi2007.iteye.com/blog/758451[/url][/color][size=large][b]前言[/b][/size]由于Lucene3.0 API的全面升级,且不再与Lucene2.X兼容, IK Analyzer为此推出了3.2.0版本。该版本仅支持Lucene2.9 /...

2009-12-07 09:27:33 118

在Tomcat下以JNDI方式发布JbossCache

[size=large][b]前言:[/b][/size] 看过JbossCache的开发手册,发现在JbossCache与AppServer的集成章节对JNDI方式的集成没有明确说明,在Jboss App Server 下,你可以使用MBean方式管理JbossCache,更多情况下,你可能需要写一个Factory类,通过API方法来启用JbossCache了。 在企业的...

2009-12-04 10:57:57 105

原创 Spring AOP小例子

[color=red][b]PS: 要注明一下,这个是转载滴,之前漏了说鸟,汗死[/b][/color]这里给一个完整的例子,以帮助初学者更好地理解,你们可以先不必理会上面的概念,等运行这个例子后,再慢慢地做照着理解。我使用的是Spring 2.0 的AOP, 它引入了一种更加简单并且更强大的方式来定义切面。马上开始吧: 首先建一个普通Java项目:com.lo...

2009-11-16 10:35:10 74

ActiveMQ 5.X 与 Tomcat 集成一(JNDI部署)

原文地址:[url]http://activemq.apache.org/setting-up-activemq-with-tomcat-559.html[/url]生成文件 /META-INF/context.xml. 以下是样例:[code="xml"] [/code]上面的配置,在Tomcat内产生了一个JMS的Conecti...

2009-11-10 15:15:12 110

发布IKAnalyzer中文分词器V3.1.6GA

[color=red]IKAnalyzer3.2.0稳定版已经发布,支持Lucene3.0和solr1.4[/color]链接:[url]http://www.iteye.com/topic/542987[/url][b][size=large]V3.1.1GA -- V3.1.5GA 版本变更一览[/size][/b][list][*]1.添加“正向最大切分算法”。[...

2009-11-08 23:10:52 106

设计模式感悟

最近又把以前学习的模式过了一遍,感觉模式不是学出来的,是悟出来的!做个简单的笔记,有空了看看,说不定时不时都有新感悟。[size=x-large]模式的法律(面向对象设计的基础准则)[/size][list][*]对“多变”的部分进行封装[*]尽量使用“组合”而少用“继承”[*]面向“接口”编程,而非面向“实现”[*]对象间的交互行为要尽可能“松耦合”设计[*]...

2009-11-07 17:57:22 67

发布IKAnalyzer中文分词器V3.1.5GA

祝贺网友-1987(李良杰)加盟IKAnalyzer开发团队,感谢他对solr集成部分的测试工作[size=large][b]V3.1.5GA版本变更:[/b][/size][b]1.新增org.wltea.analyzer.solr.IKTokenizerFactory,支持solr的TokenizerFactory接口配置[/b] 类org.wltea.analyze...

2009-10-22 23:24:00 208

发布IK Expression开源表达式解析器 V2.1.2

[b]Version2.1.2的变更: [/b]1.根据网友提出的要求,修订了对未声明变量的处理,早期版本不允许变量未申明,将抛出异常。新版本将未申明变量视为 null,这样解决了上下文中对不存在的变量的判断问题,如 “variable == null”将返回 true。下载地址:[url=http://ik-expression.googlecode.com/files/...

2009-10-03 00:37:48 223

发布IKAnalyzer中文分词器V3.1.3GA生日祝福版

[size=large][b]生日祝福[/b][/size]谨以此版本献给我的老婆,今天是她的生日,在这里,要祝福她生日快乐,天天无忧无虑。感谢她一直以来对我从事开源项目的支持和鼓励,想对她说:谢谢你,亲爱的,有你在我身边,每一天都洋溢着满满的幸福感觉![size=large][b]V3.1.3GA版本变更:[/b][/size][b]1.开放了对中文停止词表的支持,用...

2009-09-25 00:00:19 103

发布IK Expression开源表达式解析器 V2.1.1

[b]Version2.1.1的变更: [/b]1.修订了用户自定义函数参数兼容性BUG,如:double 与Float, float,Long , long,Integer ,int 的兼容性。[color=red]注:如果函数声明为 Double类型则只能与double相兼容,这与java语法一致。[/color]下载地址:[url=http://ik-expr...

2009-09-24 20:51:10 127

一个无奈的Hibernate问题

背景:1.数据库使用Oracle,表字段 ColA 被定义为 char(10)(字段类型不能修改,这个是接口方定的)2.hibernate使用NativeSQL查询(由于项目种种原因,不能使用标准Hibernate的OO方式)。问题:从list中返回了List对象,but每行的Object[]中, ColA被Hibernate转成了Character对象,只有一位,后面的cha...

2009-09-18 17:10:33 72

IKAnalyzer 3.0 中文分词器

1.IKAnalyzer3.0介绍 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer 已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0 则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 1.2IKAnalyzer3.0特性 * 采用了特有的“正向迭代最细粒度切分算法“,具有50万字/秒的高速处理能力。 * 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。 * 优化的词典存储,更小的内存占用。支持用户词典扩展定义 * 针对Lucene全文检索优化的查询分析器IKQueryParser(作者吐血推荐);采用歧义分析算法优化查询关键字的搜索排列组合,能极大的提高Lucene检索的命中率。

2009-07-21

IK Expression V2.0

IK Expression是一个开源的(OpenSource),可扩展的(Extensible),基于java语言开发的一个超轻量级(Super lightweight)的公式化语言解析执行工具包。 IK Expression V2.0不依赖于任何第三方的java库。它做为一个简单的jar,可以集成于任意的Java应用中。这包括了JavaEE应用(基于应用服务器的), Java桌面应用以及Java WebStart方式的应用。 IK Expression最初诞生的原因是为了能增强工作流引擎,如jBPM等对流程配置的灵活度。使其能在流程运行期获得同配置期一样灵活地对执行逻辑条件进行变更。经过扩展后的IK Expression还可以适用于各种常规业务系统的动态条件配置,如需要图形化配置应用的场合,或是模拟Excel电子表格的公式运算的场景。 同EL和BeanScript不同,IK Expression的设计目标是面向最终用户的,因此它被设计成语法简单(像数学算式),通俗易懂(支持中文变量及函数名)但功能有限的解析引擎。如果你需要一个功能强大的表达式引擎,也许IK Expression并不是最好的选择。 详细参阅: http://linliangyi2007.javaeye.com/blog/337069 GoogleCode开源项目 :http://code.google.com/p/ik-expression/ GoogleCode SVN下载:http://ik-expression.googlecode.com/svn/trunk/

2009-02-23

IKExpression1.0简易表达式解析器

一个适用于 OA工作流系统的简单的公式解析器。 用于工作流中的简单逻辑判断,非常易用。 也可用在二次开发中,让最终用户可以简单的配置工作流的条件 详细请查阅 http://linliangyi2007.javaeye.com/blog/299897

2009-02-01

Lucene中文分词器包

来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器。<br>1. 正向全切分算法,42万汉字字符/每秒的处理能力(IBM ThinkPad 酷睿I 1.6G 1G内存 WinXP)<br>2. 对数量词、地名、路名的优化处理<br>3. 对未知词汇采用自识别结合二元切分算法,确保搜索召回率<br>(使用方法请参考IKAnalyzer V1.1版)

2007-08-14

lucene中文分词公用组件V1.4

在lucene中文分词公用组件V1.3基础上做一下更新: 1.修订特定情况下数量词切分造成指针越界异常的BUG 2.进一步优化算法效率 3.优化词典 4.对英文和数词更改为分割处理

2007-01-19

lucene中文分词公用组件V1.3

1.修正了1.2版本在数量词处理的缺陷 2.优化分词性能 3.优化词典 请参考lucene中文分词公用组件V1.2之前版本使用说明

2007-01-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除