论文部分内容阅读
近几年,深度学习的迅速发展和普及,对机器翻译产生了极大的影响,使得基于深度学习的神经网络机器翻译(NMT)应用超越了统计机器翻译(SMT)。神经机器翻译中,解码器是根据编码器对源语言的抽象表示预测目标词序列的,正是这种抽象表示为多语机器翻译提供了可能。由于平行的语料表达的语义相同,因此编码之后的向量信息是存在着某种联系的。如果能够通过融合编码信息的方法强化完善语义向量,就可以提升翻译性能。本课题在三语平行语料上展开了融合编码信息神经机器翻译的研究,课题的研究内容包括以下几部分:(1)对比分析实验平台Groundhog和Nematus在不同规模的数据集上的实验结果,确定课题研究的实验平台。通过实验为基线系统选取合适的词嵌入的维度。使用中英日三语语料在Nematus上训练英文日文翻译系统和中文日文翻译系统作为课题研究的基线系统。(2)多语编码信息融合的神经机器翻译模型以及融合方法探究。课题介绍使用简单的向量拼接的方法把两种输入语言的编码信息融合,生成一个新的包含两种输入语言信息的中间向量,用它解码得到目标语言句子。然后又提出一种新的融合多语编码信息的翻译模型,在得到两种输入语言的编码信息之后,分别计算各自含注意力信息的上下文向量,把得到的新向量作为单层神经网的输入,信息融合得到语义丰富而全面的上下文向量,作为解码器的输入生成目标语言。最后一部分工作是探究其他信息融合的方法。融合后的向量包含了两种输入语言的语义信息。因此寻找适合的融合方法,使不同输入语言的编码信息完美的结合在一起进行解码,对提升模型效果是至关重要的。(3)主要研究使用中间语做过渡的神经机器翻译模型。课题研究的中间语言也称中轴语,对本课题而言,中轴语是中文,引入中轴语有两个原因,一是为避免融合模型中的多语输入问题;其次能够充分利用现有的英文中文语料和性能较好的中文译日文模型。验证了该方法的有效性之后,本课题尝试将中轴语模型和编码信息融合模型结合在一起,得到中轴语框架下的编码信息融合模型。因为翻译模型自身的误差,该模型的性能虽然比中轴语翻译模型好却比不上编码信息融合模型。