利用音译和网络挖掘翻译命名实体

被引:9
作者
蒋龙 [1 ]
周明 [2 ]
简立峰 [3 ]
机构
[1] 北京大学信息管理系
[2] 微软亚洲研究院自然语言计算组
[3] 台北中研院信息科学研究所
关键词
人工智能; 机器翻译; 音译; 命名实体翻译; 网络挖掘;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
081203 ; 0835 ;
摘要
本文提出了一种新颖的方法,综合利用音译和网络挖掘来提高命名实体翻译的效果。具体而言,首先利用音译模型生成一个候选翻译,然后利用音译信息配合网络挖掘获得更多的候选翻译。最后,使用最大熵(MaximumEntropy)模型综合考虑源词和候选翻译之间的各种特征,如发音相似度,上下文本特征,网页共现关系等,来排序得到的候选翻译,从而决定最终的翻译结果。实验结果显示我们的方法显著的提高了命名实体翻译的精确度。
引用
收藏
页码:23 / 29
页数:7
相关论文
共 2 条
[1]   汉英双语语料库中名词短语的自动对应 [J].
刘冬明 ;
赵军 ;
杨尔弘 .
中文信息学报, 2003, (05) :6-12
[2]   基于未对齐汉英双语库的翻译对抽取 [J].
王斌 .
中文信息学报, 2000, (06) :40-44+57