- 博客(0)
- 资源 (3)
- 收藏
- 关注
NLP分词算法,源码
最大概率分词算法,带详细源码
基于最大概率的汉语切分
目标:采用最大概率法进行汉语切分。
其中:n-gram用bigram,平滑方法至少用Laplace平滑。
输入:接收一个文本,文本名称为:corpus_for_test.txt
输出:切分结果文本,
其中:切分表示:用一个字节的空格“ ”分隔,如:我们 在 学习 。
每个标点符号都单算一个切分单元。
输出文件名为:学号.txt
2017-11-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人