共 5 条
一种基于互信息的串扫描中文文本分词方法
被引:10
作者:
赵秦怡
[1
]
王丽珍
[2
]
机构:
[1] 大理学院数学与计算机学院
[2] 云南大学信息学院
来源:
关键词:
中文分词;
词频;
互信息;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
中文分词技术是中文信息处理的基础环节,在互信息原理的基础上提出了一个基于统计的中文文本分词方法。该方法对经过预处理之后每一个串中的任意可能长度串均判断其成词的可能性,实验结果说明该算法简单且具有良好的精度及查全率。
引用
收藏
页码:161 / 162+172
+172
页数:3
相关论文

