融合多语编码信息的神经机器翻译研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:beehall
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,深度学习的迅速发展和普及,对机器翻译产生了极大的影响,使得基于深度学习的神经网络机器翻译(NMT)应用超越了统计机器翻译(SMT)。神经机器翻译中,解码器是根据编码器对源语言的抽象表示预测目标词序列的,正是这种抽象表示为多语机器翻译提供了可能。由于平行的语料表达的语义相同,因此编码之后的向量信息是存在着某种联系的。如果能够通过融合编码信息的方法强化完善语义向量,就可以提升翻译性能。本课题在三语平行语料上展开了融合编码信息神经机器翻译的研究,课题的研究内容包括以下几部分:(1)对比分析实验平台Groundhog和Nematus在不同规模的数据集上的实验结果,确定课题研究的实验平台。通过实验为基线系统选取合适的词嵌入的维度。使用中英日三语语料在Nematus上训练英文日文翻译系统和中文日文翻译系统作为课题研究的基线系统。(2)多语编码信息融合的神经机器翻译模型以及融合方法探究。课题介绍使用简单的向量拼接的方法把两种输入语言的编码信息融合,生成一个新的包含两种输入语言信息的中间向量,用它解码得到目标语言句子。然后又提出一种新的融合多语编码信息的翻译模型,在得到两种输入语言的编码信息之后,分别计算各自含注意力信息的上下文向量,把得到的新向量作为单层神经网的输入,信息融合得到语义丰富而全面的上下文向量,作为解码器的输入生成目标语言。最后一部分工作是探究其他信息融合的方法。融合后的向量包含了两种输入语言的语义信息。因此寻找适合的融合方法,使不同输入语言的编码信息完美的结合在一起进行解码,对提升模型效果是至关重要的。(3)主要研究使用中间语做过渡的神经机器翻译模型。课题研究的中间语言也称中轴语,对本课题而言,中轴语是中文,引入中轴语有两个原因,一是为避免融合模型中的多语输入问题;其次能够充分利用现有的英文中文语料和性能较好的中文译日文模型。验证了该方法的有效性之后,本课题尝试将中轴语模型和编码信息融合模型结合在一起,得到中轴语框架下的编码信息融合模型。因为翻译模型自身的误差,该模型的性能虽然比中轴语翻译模型好却比不上编码信息融合模型。
其他文献
随着宽带技术的不断发展和网络多媒体技术的日益完善,电信、联通等运营商纷纷推出流媒体业务平台。CDN作为流媒体平台的承载技术可以提供可靠的流媒体服务,但运营成本太高且
本文总结了过去两年作者在扩展“Linux实时抢占补丁”方面所从事的研究与开发工作,包含了作者对该项目所作的贡献。本文在深入分析其实现原理之后,介绍了其在MIPS(龙芯)平台
无线传感器网络(Wireless Sensor Network,WSN)由大量传感器节点组成,能够协作地完成信息的实时监测、感知和采集,并对数据进行处理,传送到用户终端。在无线传感器网络中,数
随着互联网的高速发展,信息化成为当今世界发展的潮流,网络化也是教育发展的趋势之一。高校招生报名信息管理一直是高校管理工作中的一个重要组成部分,是一项细致而复杂的工作。
VPN(Virtual Private Network,虚拟专用网络)是随着互联网的广泛应用而快速发展起来的一种新型网络技术,用于在公用网上搭建个人私有网络。随着企业规模的日益扩大,VPN技术在
随着教育的发展,传统教学模式已经无法满足当代对人才进行个性化教学的需求。翻转课堂的出现改变了原有的教学模式,它通过翻转教师和学生在课堂上的角色来激发学生主动学习的
20世纪最后20年至今,互联网的发展和普及为人们提供了一个全新的信息存储、加工、传递和使用的载体,网络信息也迅速成为社会成员获得知识和信息的主要渠道之一。传统的信息检
伴随着科技的进步和Internet的不断发展,互联网开始逐渐成为现代人了解世界的重要媒介,同时网络上的信息每天都在更新,如何才能批量而精准的获取网络媒体中的新闻和文章等信
学位
企业作为一个利益化驱使的组织,对信息具有高度的敏感性,为了使企业创造更多的利润,各部门必须要有流畅的信息流动能力,从而使企业能够在最短的时间内掌握市场信息、加工处理信息