基于attention机制的神经机器翻译模型的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xiaoyao984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的不断进步,现有机器模型已经基本达到了感知智能,正朝着认知智能前进。自然语言处理是智能认知的基础,是学界和工业界的研究热点。为了满足社会对各种语言的需求以及世界各国日益频繁交流更加的便捷,价格低廉的机器翻译研究正在逐渐兴盛。随着深度学习技术的持续提高,机器翻译也逐渐融合了这些方法和策略,并且在多个任务中斩获不错的成绩。但是还存在一些不足的地方。首先,大多数的翻译模型都基于注意力机制,去解决双语间的词语对齐问题。然而基于softmax进行归一化计算的注意力,导致无关词之间也有少量的注意力分布。因此,如何获取更加精准的注意力分布至关重要。其次,大部分神经翻译模型都是以“编码-解码”结构为基础的。整个模型的翻译都依赖自回归机制,所以每生成下一个词都是基于已完成的词,导致了模型的解码效率不高以及不能获取译文的全局消息。最后,词向量是模型获取语义以及语法信息的根本所在,因而如何获得蕴含更全面语义和语法信息的词向量十分关键。基于上文所述的问题,本文主要进行如下几个方面的研究:1、针对翻译中注意力的精准对齐问题,本文采用了稀疏归一化的方法去代替常用的softmax归一化,并在以Transformer为基础框架的神经机器翻译系统上进行了试验论证。实验结果表明,通过稀疏预测词中最大权值的相关词,减少无关词的不必要权值分布,缓解了数据之间归纳偏差问题,增强了翻译系统的准确性和可解释性。2、针对Transformer在推理阶段解码时间随译文长度成平方增长的问题,本文采用了累加方式的平均注意力层去缓解此问题。此外在神经机器翻译模型中,只可以利用前序生成序列信息的问题,本文融合了推敲神经网络的思想,通过两次解码获取了相关生成语句的全局信息。实验结果显示,两次解码后翻译的句子更加连贯且句义更加完整。3、针对目前大多数模型采用基于单词的嵌入向量表示,提出了多表征融合的词向量,使用字符级别编码向量和单词级别编码向量直接拼接的方法。多表征融合的词向量可以有效的解决词表中的未出现词以及一些低频词,可以表达更加完整词义信息,直接影响整个翻译模型性能。通过实验结果可以看出,我们提出的融合方法和策略,有效的提升整体翻译模型的翻译效果与质量。
其他文献
目前,越来越多的文档以数字资源的形式呈现在互联网上。这些文档内容繁多、结构混乱,使得从这些文档中快速提取有效信息的工作变得十分困难。实体关系抽取作为实现信息结构化的关键技术,可以很好的解决这个问题,并在构建知识图谱、智能问答系统以及自然语言生成方面有着非常重要的作用。基于深度学习的关系抽取在关系抽取中有着比较不错的效果。但是基于深度学习的算法的数据预处理中添加了越来越多由自然语言处理工具得到的额外
随着我国信息科技实力的不断提升,网络空间中的内容极速膨胀,大量数据问题一涌而出,如:博客网站充斥了大量的抄袭内容,搜索出的内容重复性极高;智能客服对话系统需要根据用户提问从海量数据库中匹配到最相关的答案;网络云盘中的重复文件浪费了巨大的物理存储空间。解决数据爆炸增长所带来的各种问题是一项重要的研究,而文本语义相似度计算正是解决这些问题的必备技术。文本语义相似度计算是本文的研究主题。本文做了大量的研
学位
随着无人船集群技术的加速发展,海上无人系统的研发与训练也变得至关重要。有效的海上无人系统能够打破单船能力的局限性,协同集群中每艘无人船从而激发出整个集群的力量。然而训练海上无人系统需要大量且有效的无人船实验数据,无人船实验数据的获取不可避免地受到时间,环境,人力,财力等多种因素的限制,如何在短时间内低成本地获取海量训练数据将成为传统无人船训练系统一项新的挑战。本文经过对无人船训练系统的研究和分析,
学位
近年来,随着数据资源和计算能力的增长,机器学习快速发展,被应用到各个领域,例如:图像识别、行人检测、航空监管等等。在机器学习训练阶段使用的数据越多,则预测阶段机器学习模型精度越高。然而,海量数据的使用对本地计算资源带来了挑战。得益于云服务的应用,大量的机器学习的训练和预测都被外包到云服务器上进行。然而云服务自身数据安全事件频发,这加剧了公众对于数据泄露的担忧。为了解决云服务环境下机器学习中的数据泄
现如今,随着人们的生活压力和工作压力的不断提高,人们的健康问题日益凸显,据统计数据显示中国人民约70%的人处于亚健康状态,因此关注自身健康变得愈发重要。目前健康管理的理念逐渐走进人们视野,并且健康管理的国内市场也逐步火热。健康管理中比较重要的一部分就是营养摄入平衡,而人体每日所需营养中通过液体摄入的不占少数,例如水,维生素,蛋白质等,因此液体检测技术作为营养监测的一种途径显得尤为重要。液体检测技术
随着异构无人系统的应用越来越广泛,多机器人协同成为趋势,而异构多机器人协同的基础是要实现异构平台或设备的互联互通并进行有效的信息交互。但是由于执行协同任务的无人系统并非来自于同一生产厂商的同一型号,所以无人系统间建立互联互通就会带来诸多问题。比如最常见的由于无人系统间接口标准、数据传输方式以及能力的不同,使得无人系统表现出很强的个体异构性,影响无人系统的通信效率,为了屏蔽异构性,通常的实现方式是将
随着数字化时代的到来,人们在问答系统、智能客服、信息检索、文本复述、机器翻译等人工智能领域的需求日益增长。为了提供高质量、高效性的服务,无数学者投入到文本语义匹配的相关技术研究中。作为自然语言处理领域的一项基本问题和研究热点,过去文本语义匹配问题的相关研究主要是基于统计机器学习技术的。该类语义匹配模型需要消耗大量的人力成本才能挖掘出文本潜在的特征。随着深度学习技术的日新月异,文本数据的特征提取不再
多标签文本分类作为自然语言处理领域的一项基础任务,广泛应用于情感分析、问答系统和推荐系统等领域。本文主要研究基于深度学习的多标签文本分类,通过深入分析了多标签文本分类的难点并从当前的国内外研究现状中受到启发,提出了两种多标签文本分类模型:1.本文第一个模型提出一种融合标签注意力机制和自注意力机制的方法来获取文本特征表示,同时在模型预测层加入了关系网络来获得标签间的相关性。标签信息对文本分类起重要作