语言模型中一种改进的最大熵方法及其应用

被引:13
作者
李涓子
黄昌宁
机构
[1] 清华大学计算机科学与技术系
[2] 清华大学智能技术与系统国家重点实验室
关键词
语言模型; 最大熵模型; 参数估计; 特征选择; 互信息; Z-测试;
D O I
10.13328/j.cnki.jos.1999.03.007
中图分类号
TP301.2 [形式语言理论];
学科分类号
081202 ;
摘要
最大熵方法是建立统计语言模型的一种有效的方法,具有较强的知识表达能力.但是,在用现有的最大熵方法建立统计模型时存在计算量大的问题.针对这一问题,提出了一种改进的最大熵方法.该方法使用互信息的概念,通过Z-测试进行特征选择.将该方法应用于汉语的义项排歧中,实验表明,该算法具有较高的计算效率和正确率
引用
收藏
页码:34 / 40
页数:7
相关论文
empty
未找到相关数据