共 2 条
利用音译和网络挖掘翻译命名实体
被引:9
作者:
蒋龙
[1
]
周明
[2
]
简立峰
[3
]
机构:
[1] 北京大学信息管理系
[2] 微软亚洲研究院自然语言计算组
[3] 台北中研院信息科学研究所
来源:
关键词:
人工智能;
机器翻译;
音译;
命名实体翻译;
网络挖掘;
D O I:
暂无
中图分类号:
TP391.2 [翻译机];
学科分类号:
081203 ;
0835 ;
摘要:
本文提出了一种新颖的方法,综合利用音译和网络挖掘来提高命名实体翻译的效果。具体而言,首先利用音译模型生成一个候选翻译,然后利用音译信息配合网络挖掘获得更多的候选翻译。最后,使用最大熵(MaximumEntropy)模型综合考虑源词和候选翻译之间的各种特征,如发音相似度,上下文本特征,网页共现关系等,来排序得到的候选翻译,从而决定最终的翻译结果。实验结果显示我们的方法显著的提高了命名实体翻译的精确度。
引用
收藏
页码:23 / 29
页数:7
相关论文

