汉语词语边界自动划分的模型与算法

被引:12
作者
付国宏
王晓龙
不详
机构
[1] 哈尔滨工业大学计算机科学与工程系!哈尔滨
[2] 香港理工大学计算机系!香港
关键词
汉语分词,词形,字结合点;
D O I
暂无
中图分类号
学科分类号
摘要
在引入词形和汉字结合点等概念基础上,文中分别描述了一个基于字串构词能力的词形模型和一个基于词语内部、外部汉字结合度的汉字结合点模型,并采用线性插值方法将两种模型融合于一体进行汉语词语边界划分.在分析汉语切分候选空间的基础上,文中还给出了相应的优化搜索算法.与一般的统计方法相比,文中方法的模型参数可直接从未经加工粗语料中得到,具有较强的适应能力.初步试验表明该方法是有效和可靠的
引用
收藏
页码:1142 / 1147
页数:6
相关论文
共 2 条
[1]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[2]   一种汉语分词方法 [J].
吴胜远 .
计算机研究与发展, 1996, (04) :306-311