融合语义角色的神经机器翻译研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:liujj08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译作为自然语言处理中的热门领域,近几年获得了迅速发展。从传统的统计机器翻译(Statistical Machine Translation,SMT)到基于循环神经网络的神经机器翻译(RNN-based Neural Machine Translation,RNMT),然后发展为以 Transformer 为代表的基于自注意力机制的神经机器翻译。目前,神经机器翻译逐渐成为机器翻译的研究主流。神经机器翻译使用编码器-解码器架构,编码器分析源端句子,解码器生成目标端句子。然而,由于缺乏语言学知识的指导,译文往往会出现错译、漏译和过译等问题。语义角色作为语言学知识的一种,常用于表示句子的语义,一个好的译文在语义上与原文通常是等价的。因此,本文针对RNMT和Transformer这两种神经机器翻译模型,探索了语义角色在其中的应用,本文主要包含以下两方面研究内容:(1)本文提出两种融合源端语义角色的RNMT模型,第一种模型将语义角色标签嵌入到句子词汇序列合适的位置,用于表示句子哪些片段担当了何种语义角色;第二种模型为源端句子的每个单词制定含有语义角色信息的特征,并将词向量与该语义角色特征向量拼接获得新的词向量。在中英翻译任务上的实验结果表明,本文提出的两种融合语义角色的RNMT模型在多项评测指标上都获得了提升。进一步的实验分析也表明本文提出的模型在长句翻译和漏译情况上都取得了比基准系统更好的效果。(2)本文提出两种融合源端语义角色的Transformer模型。第一种模型扩展源端编码器中的多头自注意力机制,使其能够加入语义角色信息;第二种模型额外增加一种语义角色编码器,新增的语义角色编码器能够融合源句及其语义角色信息。在英德翻译任务上的实验结果表明,本文提出的两种融合语义角色的Transformer模型在多项评测指标上都获得了提升,进一步的实验分析也表明译文质量得到改善。
其他文献
随着社会经济的快速发展,土地利用变化已成为区域性环境变化的主导因素,土地资源匮乏日趋严峻,导致人地矛盾突出。本文以宁夏中卫至石嘴山沿黄两岸土地利用变化及其对河道演
河北边庄北核电项目正在规划实施中,是我国首个位于软土地基上的核电站,具有开创性的意义,但核电站基坑工程在软土地基与在基岩上施工,技术上有着极大的差别。在基岩上施工的
自然界中生物的眼睛大致上可以分为两类:人类的单眼和昆虫的复眼。眼睛作为一种主要的目视光学系统,在对目标进行观察时,尽可能选择视场角较大的光学系统,便可以同时获得更多
自2008年京津城际的正式通车,中国的高速铁路网络建设逐步走上了快车道,截止2019年12月,我国高铁运营里程达到3.5万公里,运营里程世界第一。随着高速铁路的开通,不仅提升了铁
秦山第二核电厂1/2#机组常规岛开式冷却水系统(以下简称:SEN系统)的作用为向常规岛闭式冷却水系统提供冷却水源,常规岛设备的状态取决于该系统是否稳定。SEN系统的取水口为杭
国家认同是一种重要的国民意识,是国家政治和文化安全的重要组成部分,是维系一个国家生存和发展的精神纽带。青年大学生是推动国家发展与社会进步的新生力量,其国家认同状况
为了满足人们对多媒体业务的传输需求,迫切需要一种大容量、高速率和高可靠性的无线通信网络。信道编码技术可以抵御数据在信道传输时各种干扰,提高数据传输效率和系统可靠性
肝脏医学图像的精准分割是辅助医生对肝脏病症患者进行疾病诊断,形成准确的术前规划,术中指导,术后评价的重要前提,对临床手术起着很重要的指导作用。近些年来,肝脏分割算法
随着机器视觉技术的快速发展,应用领域的不断扩大,尤其在工业上,它已然成为获取信息的工具之一,也是一个体现工业4.0智能化的关键技术。本文将以机器视觉为主导,研究复杂多样的汽车小零件在非结构环境下的定位抓取工作。内容上,它包含目标识别分类和定位抓取,同时,也涵盖机器人在抓取过程中路径规划设计。从难度上来看,机器人在对目标识别方面存在两个难题:第一,当众多汽车小零件错综复杂的叠放在一起时,由于种类的复
二维碳材料由于具有高比表面积、高导电性、高稳性定、可负载多种有机无机活性材料等特征而被广泛应用于如锂离子电池、钠离子电池、超级电容器和燃料电池等能源存储与转化器