基于LSTM的蒙汉机器翻译的研究

被引:8
作者
刘婉婉
苏依拉
乌尼尔
仁庆道尔吉
机构
[1] 内蒙古工业大学信息工程学院
关键词
注意力; 端到端模型; 机器翻译; 蒙汉; LSTM神经网络;
D O I
暂无
中图分类号
H085 [机器翻译]; TP183 [人工神经网络与计算];
学科分类号
050211 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
由于内蒙古地区蒙汉机器翻译水平落后、平行双语语料规模较小,利用传统的统计机器翻译方法会出现数据稀疏以及训练过拟合等问题,导致翻译质量不高。针对这种情况,提出基于LSTM的蒙汉神经机器翻译方法,通过利用长短时记忆模型构建端到端的神经网络框架并对蒙汉机器翻译系统进行建模。为了更有效地理解蒙古语语义信息,根据蒙古语的特点将蒙古文单词分割成词素形式,导入模型,并在模型中引入局部注意力机制计算与目标词有关联的源语词素的权重,获得蒙古语和汉语词汇间的对齐概率,从而提升翻译质量。实验结果表明,该方法相比传统蒙汉翻译系统提高了翻译质量。
引用
收藏
页码:1890 / 1896
页数:7
相关论文
共 10 条
[1]   基于词向量的藏文词性标注方法研究 [J].
郑亚楠 ;
珠杰 .
中文信息学报, 2017, (01) :112-117
[2]   基于句法的统计机器翻译模型与方法 [J].
刘群 .
中文信息学报, 2011, 25 (06) :63-71
[3]   基于短语统计机器翻译模型蒙古文形态切分 [J].
李文 ;
李淼 ;
梁青 ;
朱海 ;
应玉龙 ;
乌达巴拉 .
中文信息学报, 2011, 25 (04) :122-128
[4]   汉蒙统计机器翻译中的形态学方法研究 [J].
杨攀 ;
张建 ;
李淼 ;
乌达巴拉 ;
雪艳 .
中文信息学报, 2009, 23 (01) :50-57
[5]  
双语平行语料的预处理[J]. 张霄军,陈小荷.外语教育. 2007(00)
[6]   关于蒙古语语义分析的思考 [J].
德·萨日娜 .
内蒙古社会科学(汉文版), 2004, (03) :95-97
[7]   关于蒙古语人称代词词干变格问题 [J].
哈斯巴特尔 .
民族语文, 2001, (03) :27-33
[8]  
统计机器翻译语料预处理中的问题研究[D]. 修驰.北京语言大学. 2009
[9]  
Modelling and Optimizing on Syntactic N-Grams for Statistical Machine Translation[J] . Rico Sennrich.Transactions of the Association for Computational Linguistics . 2015
[10]   LSTM recurrent networks learn simple context-free and context-sensitive languages [J].
Gers, FA ;
Schtmidhuber, J .
IEEE TRANSACTIONS ON NEURAL NETWORKS, 2001, 12 (06) :1333-1340