- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 solr3.5同时配置paoding,IKAnalyzer,mmseg4j三种分词器词库
[color=blue][size=large]solr同时配置三种中文分词器到schema.xml。关键点在三种分词器的词库配置。[/size][/color]先下载三种不同版本的分词器mmseg4j-1.8.5.zip;IKAnalyzer3.2.8 bin.zippaoding-analysis-2.0.4-beta.zipsolr版本:3.5web服务器:t...
2013-05-31 17:15:20 75
原创 Tesseract-OCR 识别中文
3.2版本试了中文和英文,反正我这里不怎么样,我觉得识别率很低。jar包和测试文件放上来,有机会谁去测测。tesseract-ocr-3.02.eng.tar.gz,tesseract-ocr-3.02.chi_sim.tar.gz这语言包太大了,自己去下吧...
2013-02-20 16:51:25 87
原创 alfresco中的solr提出单独搭建solr服务器
alfresco安装好的目录中 有一个自带的web容器tomcat,里面同时跑了alfresco和solr两个web工程,两个工程之间互相通信如果想分别部署,需要分别部署在两个web容器中,两个web容器可以放在不同的机器上,这样可以单独有一台搜索服务器,提高性能下面来说说步骤 下面的web容器全部以tomcat为准1. web容器中先部署solr工程 在web容器中,tom...
2012-10-10 15:52:55 73
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人