共 12 条
改进的基于词典的中文分词方法
被引:40
作者:
莫建文
郑阳
首照宇
张顺岚
机构:
[1] 桂林电子科技大学信息与通信学院
来源:
关键词:
中文分词;
词典;
哈希结构;
正向最大匹配算法;
歧义;
D O I:
10.16208/j.issn1000-7024.2013.05.039
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
为了能够快速、准确地进行中文分词,在传统分词词典构造及相应算法的基础上,提出了改进的基于词典中文分词方法。该方法结合双字哈希结构,并利用改进的正向最大匹配分词算法进行中文分词,既提高了分词速度,同时解决了传统最大匹配分词算法中的歧义问题。实验结果表明,该方法在一定程度上提高了中文词语切分的准确率,同时大大缩短了分词时间。
引用
收藏
页码:1802 / 1807
页数:6
相关论文

