基于改进自注意力的机器翻译新模型

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户：tiger20091

【摘要】

：

【作者】

：

纪明轩

【出处】

：

南京邮电大学

【发表日期】

：

2021年03期

【关键词】

：

机器翻译自然语言处理递归神经网络卷积神经网络自注意力位置编码对数位置表示残差连接

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器翻译是自然语言处理中的核心任务。当前的神经机器翻译模型主要是基于递归神经网络和卷积神经网络的深度网络模型,但仅仅使用递归神经网络和卷积神经网络处理文本都具有一定的局限性。近几年,自注意力机制在自然语言处理中的多个领域中展现出优越的性能。因此,文中将自注意力机制应用于机器翻译,针对机器翻译任务的特点,对传统的自注意力机制进行改进,设计新模型。论文的研究内容和取得的成果主要如下:1.在机器翻译任务中,自注意力机制由于高度可并行化计算的能力显著减少了模型的训练时间,并且可以有效地捕捉到上下文中所有单词之间的语义相关度而受到了广泛的关注。然而,不同于循环神经网络,自注意力机制的高效源于忽略上下文单词之间的位置结构信息。为了使模型能够利用单词之间的位置信息,基于自注意力机制的机器翻译模型Transformer使用正余弦位置编码方式表示单词的绝对位置信息,然而,这种方法虽然能够反应出相对距离,但却缺乏方向性。因此,文中基于对数位置表示方法,并与自注意力机制相结合,提出一种机器翻译新模型。该模型不仅继承了自注意力机制的高效性,还可以保留单词之间的距离信息与方向性信息。研究表明,与传统的自注意力机制模型以及其它模型相比,文中所提新模型能够显著地提高机器翻译的准确性。2.在机器翻译领域,近年来许多将自注意力机制和递归神经网络结合的新模型被提出,研究表明这些复合模型在机器翻译任务上的性能超越了单独的自注意力机制或递归神经网络。虽然通过引入更多参数加强了模型获取结构信息的能力,但过多参数产生的冗余信息并不一定能够加强机器翻译系统的性能,甚至在一定程度上会影响翻译效率。因此,文中引入更加轻量级的门控循环单元网络,与自注意力机制相结合,设计更加高效的机器翻译模型。模型采用“残差连接”机制将两种编码器的结果相结合,“残差连接”机制可以保留底层的结构信息并传递给高层编码器,解决梯度爆炸和消失问题。实验结果表明,底层的门控循环单元网络有效地保存了文本中的层次结构信息,并与自注意力机制的语义分析有着紧密集合。相较于其它模型,该模型对于自然语言和人工语言的处理具有一定优势。3.最近研究表明,自注意力机制通常专注于独立的单词,却忽略连续的短语形式,而短语被认为在机器翻译中是必不可少的形式。有关机器翻译研究现状的工作表明,将基本单元从单词扩展到短语可以对译文质量产生实质性的提高,这表明可以通过对短语显式地建模来提高神经机器翻译系统的性能。而在以往的研究中,没有工作明确将短语建模和层次结构建模相结合。因此,文中提出粒度细化,然后通过限制注意力范围来增强模型获取局部信息的能力,因此本文提出的方法参数更少,更加轻量级,对于计算能力的要求也更低。自注意力机制通常由多层编码器-解码器递归组成,其中高层倾向于学习语义信息,而低层则倾向于捕获结构信息和词汇信息。因此,文中仅将局部性建模应用于底层,即底层自注意力层拥有距离感知和提取局部信息的能力,而高层则捕获与距离无关的全局语义信息。实验结果表明,文中提出的新模型能够显著改善神经机器翻译模型的性能。

其他文献

10kV多用户线路相间短路保护整定计算实例

本文通过一条多用户１０ｋＶ线路的整定计算，说明了电流速断保护采用配变配合法的灵敏度远远高于常规方法灵敏度，特别适用于短线路或系统运行方式变化较大的场合，对于过电流保护的最大负

期刊

10kV线路电流保护整定计算

四维、二维超声子宫内膜癌诊断对比研究

目的：以病理诊断为金标准，对比观察四维、二维超声诊断子宫内膜癌的检出率、术前临床分期准确率和诊断符合率。方法：对12例子宫内膜癌患者分别进行二维和四维彩色多普勒超声检查

期刊

子宫内膜癌四维超声二维超声诊断

将传统文化精髓熔铸于人物的精神世界

电视剧《老中医》以“厚德精术、良药善医”作为全剧的精神主旨，着力透过人物在危难和困境之中的价值抉择，将其熔铸于“孟河医派”传人翁泉海的行医历程中，使之升华成为饱含精神

报纸

10kV线路保护动作原因及改进

在10kV配电线路运行过程中,时常发生因配电变压器励磁涌流导致的配电线路电流保护动作。本文主要从励磁涌流产生的原理及影响入手,重点对10kV配电线路存在的问题进行了分析,

期刊

10kV线路保护动作改进

推拿结合中药贴敷治疗小儿肌性斜颈25例

目的:观察推拿手法结合中药贴敷治疗小儿肌性斜颈的疗效.方法:采用捻、揉、弹拨等推拿手法,结合山楂、伸筋草、威灵仙、红花等中药贴敷,对25例患儿进行治疗.结果:25例患儿中,

期刊

肌性斜颈小儿推拿治疗中药贴敷治疗

基于PLC和伺服单元的自动涂胶系统的开发

针对某玻璃公司真空玻璃涂胶工作站改造项目的需求，对原有操作台进行机械和电气改造。利用光纤传感器和电磁传感器采集位置信号，西门子S7—200系列PLC采集和处理数据，通过安川∑

期刊

可编程控制器伺服单元自动涂胶系统

MRA对颅内未破裂动脉瘤的诊断价值

目的：探讨MRA容积显示（VR）结合最大密度投影（MIP）对颅内未破裂动脉瘤的诊断价值。方法：对749例非出血性原因行MRA检查的患者进行VR及MIP成像，分别由两位有经验的放射科医师对所有图

期刊

颅内未破裂动脉瘤容积显示(VR)最大密度投影(MIP)诊断

茶树营养芽幼叶数与展叶数的相关研究

<正> 营养芽是新梢的雏体,芽内幼叶数与新梢展叶数的关系,直接关系芽叶的产量与质量。探明芽内幼叶数与新梢展叶数的关系,对栽培上充实芽体,加强幼叶分化,增进新更多还原

期刊

茶营养芽幼叶数展叶数相关性

基于主题模型的专利挖掘算法研究与应用

专利是知识产权中重要的一种表现形式,对海量专利数据进行深入挖掘得出技术信息,有助于促进知识产权的保护和专利的再创新。文本主题模型属于数据挖掘中的重要部分,应用于不同领域的主题信息提取。目前专利分析领域中,专利技术主题通过主题模型对专利文本直接进行主题提取获得,会导致提取的主题信息过于杂乱,不能很好的表达主题含义以及不能获取细粒度的技术主题等问题。专利的国际专利分类(International Pa

学位

专利主题模型文本分析主题挖掘技术演化

KPI-RBRVS绩效管理体系在民营医院中的构建研究

医院是医疗体系中的基础,是人们生存发展最基本的保障,也是提高人民生活质量、幸福水平的重要一环。民营医院经过不断地发展,现已成为除了公立医院最大的医疗服务机构群体。

学位

民营医院绩效管理RBRVSKPI

基于改进自注意力的机器翻译新模型

与本文相关的学术论文