共 6 条
汉语文本自动分词算法的研究
被引:11
作者:
何国斌
赵晶璐
机构:
[1] 西南大学计算机与信息科学学院
来源:
关键词:
自动分词;
分词算法;
字典;
歧义切分;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
分析了中文分词词典的机制,提出了一种改进的整词分词字典结构,并针对机械分词算法的特点,将其与概率算法相结合,探讨了一种中文自动分词概率算法。采用哈希及二分法对词典进行分词匹配。实验表明,该算法具有较高的分词效率和准确率,对于消去歧义词也有较好的性能。
引用
收藏
页码:125 / 127+130
+130
页数:4
相关论文

