- 博客(0)
- 资源 (1)
- 收藏
- 关注
中文信息检索系统的模糊匹配算法研究和实现
在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词
匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法 ],针对汉字
拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上。实验表明,本文提
出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到“子线性”的效率。
2013-10-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人