融合句法知识的汉-越机器翻译方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:lincystar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越南是我国的重要邻国,在政治、经济、文化上都与我国有着密切的交流合作。并在“一带一路”的政策下,我国与越南的交流合作更加密切,急需机器翻译技术的发展。然而,现有机器翻译技术水平不能满足于快速的经济文化发展,主要原因是汉语和越南语双语平行语料的稀缺制约了汉-越机器翻译的发展。近年来,基于循环神经网络的机器翻译得到迅速发展,但其翻译性能的提升依赖于大规模的双语平行语料。因此,利用技术方法来提升翻译性能成为了当前的研究热点。基于此,本文针对汉语和越南语的语言特点和汉语和越南语间存在语言差异性,研究如何将词性信息与句法解析树融合到卷积神经机器翻译模型中,本文的主要研究工作为以下三个部分:(1)融合词性信息的汉-越卷积神经机器翻译方法词性信息对机器翻译译文语序的生成具有约束作用。本文针对汉语和越南语在词语修饰关系上存在差异,以及汉-越机器翻译译文面临语序不一致的问题,考虑将词性信息融合到机器翻译模型中,以调节译文的语序。因此,提出融合词性信息的汉-越卷积神经机器翻译方法。该方法首先采用带词性标记的双语对齐语料,生成带词性的双语词表,然后采取多层卷积神经网络及不同大小卷积核进行汉越神经机器翻译模型的训练,利用带词性的词表对汉越双语语料进行词与词性的联合编码与解码,将词性信息融合到翻译模型中。(2)融合句法解析树的汉-越卷积神经机器翻译方法句法分析是用于判定输入句子单词序列的构成是否符合规定的语法规则,之后,用构造的句法解析树对句子的层次结构、各个层次中句法的成分关系进行确定,即能够从句法解析树中得知句中的短语是由哪些词构成的,动词的主语或宾语是哪些词等句法信息。因此,在融合词性信息后,本文进一步研究融合句法解析树的汉-越卷积神经机器翻译方法,充分利用句法解析树中的句法结构信息,帮助卷积神经机器翻译模型更好地获取句法知识,以约束译文句法结构的生成。该方法首先采用斯坦福的汉语句法解析器和越南语的句法解析器分别对汉语和越南语进行句法解析,分别得到汉-越句法解析树,然后,利用深度优先遍历的方法对汉越句法解析树进行遍历,以得到汉语和越南语中每个叶子节点对应的句法标签序列,之后对每种标签定义固定的特征编码,最后将句法向量与源语言词嵌入相加作为编码器的输入,并采取多层卷积神经网络、不同大小卷积核及具有词性信息的词表进行汉-越神经机器翻译模型的训练。(3)融合句法知识的汉越机器翻译系统结合融合词性信息与句法解析树的卷积神经机器翻译方法,设计并实现了融合句法知识的汉-越机器翻译系统。该系统主要包含WEB的前后端服务模块与机器翻译模块。其中,机器翻译的功能模块主要包括输入与输出功能模块、文本预处理功能模块和翻译功能模块。翻译功能模块是在Facebook提出的卷积神经机器翻译框架的基础上做了相应修改实现的,主要包括将汉语和越南语的词性信息与句法解析树融入到卷积神经机器翻译框架中。该系统对研究汉越句法知识与卷积神经机器翻译相融合提供了重要的支撑作用。
其他文献
学位
传递矩阵法求解旋转壳体振动特性时,数值计算方法的自适应性决定了计算的精度和效率。对于旋转壳体的固有振动、受迫振动和子结构分段中自适应方法的研究,可以为该类结构的动力学特性分析提供一个可靠有效的数学工具,将传递矩阵法推广到更多工程领域的振动分析中。对于自由振动问题,本文基于薄壳振动的基本方程,采用传递矩阵法和矩阵指数自适应积分方法求解了圆锥壳体的固有频率和振型,通过与有限元结果的对比发现两者的固有频
学位
钎料的无铅化已经研究多年,并逐步进入实际生产和制造中。近年来,有研究者从连接技术上探索高铅钎焊的替代方法。其中,瞬时液相连接是采用高熔点金属和低熔点金属的混合粉末混合成复合钎料,连接过程中利用低熔点金属粉末熔化形成液相实现连接,同时与高熔点金属粉末固-液互扩散反应形成新的高熔点连接层,从而实现功率芯片的低温连接,耐高温服役。通过研究瞬时液相连接的互联工艺下,向Sn4.7Ag1.7Cu无铅钎料中添加
环境治理和高效可持续再生能源的开发是当前社会发展的两大难题。光催化技术能够实现污染物的高效光催化降解、消毒杀菌、水分解和CO2还原等,且光催化剂具备无毒、廉价、稳定和可重复使用的优点,因而成为能源和环境领域的研究热点。二维光催化材料具备独特的电子和结构优势,是实现高效光催化反应的理想材料。然而二维光催化材料中光生载流子复合率较高明显制约了光催化性能的提升。通过对材料之间合理的界面电荷和能带结构调控
材料和周围介质发生化学、电化学反应会产生腐蚀从而使其遭受破坏,在材料表面制备超疏水涂层能够有效提高其耐腐蚀性能。迄今为止,研究者已开发多种金属基材超疏水表面的制备方法。然而这些方法大多使用含氟试剂作为原料之一,采用化学或电化学刻蚀、电沉积等手段。含氟试剂昂贵且对环境安全和人类健康有害;而用化学或电化学刻蚀、电沉积等手段不利于大规模生产应用。基于此,本文以无氟的氧化锌/植物油或冷镀锌喷漆为原料,采用
阳极氧化是铝合金常用的提高耐蚀性能和增加表面特殊功能的方法,铝合金的表面脱氧工序是铝合金阳极氧化工艺中的关键工艺步骤,目前脱氧溶液均采用含有较高浓度铬酸酐的溶液,它不仅在生产过程中产生大量毒性很大的含铬废水,危害生态环境和人体健康,而且存在不能按照工艺规范将腐蚀速率调整到规定值的问题,严重影响了铝合金阳极氧化的质量,因此,研究出一种高效、稳定、环保的无铬脱氧溶液具有重要意义。本文研究了一种无铬脱氧
本文针对K465镍基高温合金在制造使用过程中出现缺陷和损伤,而快速修复的问题,采用激光熔覆修复技术自配的镍基粉末进行单层单道修复实验、单层多道修复实验和单道多层修复实验,筛选出激光熔覆修复K465的最佳参数组合,并将其运用到K465基体模拟损伤的挖槽修复中,实现了高质量修复。进一步对修复层实施双级时效处理,使激光熔覆K465修复层以抗拉性能为主的各项性能得到提高。为了提高修复试样的抗高温热腐蚀性能
随着楔横轧工艺研究的深入与推广,对楔横轧坯料的要求也越来越宽,仅依靠传统圆形坯料会使楔横轧工艺在推广上受到一定的限制,特别是有些大型零件如火车轴等难以获得如此大型的圆形棒料。故研究基于方形坯料的楔横轧成形工艺具有重要的现实意义。方形坯料的楔横轧是在传统楔横轧工艺上对原材料选取的突破,轧件除了会产生端部凹心和微观组织不均匀性,还受坯料形状的影响对轧件力学性能和表面质量产生作用。本文对方形坯料的楔横轧
海洋平台的导管架在使用过程中,会受到海洋环境的影响,导致导管架的钢管桩受到损伤,工作时间越长,损伤越严重。为了保证达到设计的使用寿命和增加导管架平台的安全性,需要对受损部分进行加固处理。本文对修复加固技术中的灌浆卡箍修复进行了详细的分析。灌浆卡箍加固修复技术凭借其安装方便、造价底等特点广泛应用于海洋平台的加固,但是在具体承载力方面的研究略显不足,因此本文的目的是对海洋平台导管架的承载力性能进行分析