基于隐马尔科夫模型的中文分词研究

被引:14
作者
魏晓宁
机构
[1] 南通大学计算机科学与技术学院
关键词
自动分词; 隐马尔科夫模型(HMM); N-最短路径粗切分; 统计模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
一直以来,汉语自动分词是公认的汉语信息处理瓶颈。反思现有汉语自动分词技术,发现均有隐含两大假设:语言是规律的、词具有确定边界。这与语言的复杂性、组合性、动态性、模糊性特征不符。本文采用一种基于隐马尔科夫模型(HMM)的算法,通过CHMM(层叠形马尔科夫模型)进行分词,再做分层,既增加了分词的准确性,又保证了分词的效率。
引用
收藏
页码:885 / 886
页数:2
相关论文
共 3 条
[1]   基于N-最短路径方法的中文词语粗分模型 [J].
张华平 ;
刘群 .
中文信息学报, 2002, (05) :1-7
[2]   一种改进的快速分词算法 [J].
陈桂林 ;
王永成 ;
韩客松 ;
王刚 .
计算机研究与发展, 2000, (04) :418-424
[3]  
隐Markov模型及其在自然语言处理中的应用 .2 于江生. .