- 博客(2)
- 资源 (1)
- 收藏
- 关注
有关lucene分布式的实现
通过一段时间的测试修改,项目终于上线了[url]http://www.dilingling.com[/url],此项目是基于lucene开发的。随着数据量的增加现在要考虑分布式如何做了,有此方面的经验朋友欢迎交流。...
2007-03-21 17:41:13 151
有人研究nutch吗?
最近由于工作需要,研究了一下nutch,遇到几个问题,不知道有没有这方面有经验的同行 一是url抓取的过滤正则crawl-urlfilter.txt 加上 +^http://abc.com/[a-zA-Z]*/就不能正常抓取 二是我只想抓取详细内容页,即不想抓取列表页,但想想在抓取上没法做.因为过滤了列表页就不会有详细页,所以我在创建索引上过滤,只索引详细页,在regex-urlfilter....
2006-12-08 15:11:49 81
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人