若干低资源条件下的神经机器翻译研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:aaronfly08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的不断发展和科学技术的不断进步,多语言之间的翻译需求不断增大,机器翻译已经成为人们解决大量翻译任务的常用方法。近年来,神经机器翻译凭借其出色的翻译性能成为机器翻译的主流方法。神经机器翻译模型的训练需要大量的平行语料,语料的领域、质量、数量对模型性能影响较大,而实际研究背景中,数据资源短缺是一个普遍存在的问题,平行语料的领域和语言类别都较为稀少。为了解决这一问题,本文提出若干低资源条件下的神经机器翻译研究,旨在提高低资源条件下译文的翻译质量。(1)针对领域低资源的翻译问题,本文提出基于领域特征的神经机器翻译领域适应方法。在领域低资源的问题中,通常外领域的语料资源丰富,内领域的语料资源稀缺,利用资源丰富领域的语料能帮助资源稀缺的领域提升翻译质量。方法首先利用多层感知器训练领域判别器,使其具有自动判断句子领域类别的能力;其次修改模型目标函数,联合生成器和领域判别器,分别训练特征敏感网络和特征不敏感网络;最后使用集成学习的方法融合生成器、特征敏感网络、特征不敏感网络完成翻译预测。方法在中英广播对话领域和英德口语领域进行实验,结果表明,该方法能充分学习领域特征,提升低资源领域译文质量。(2)针对平行语料低资源的翻译问题,本文提出利用双语词典的低资源神经机器翻译方法。在仅有单语语料资源情况下,方法提出将单语语料通过双语词典替换,使得多个单语语料只包含一种语言,达到了共享词嵌入向量的效果,再进行翻译模型训练。方法分别使用真实双语词典和规约双语词典构建训练语料,其中规约双语词典由向量相似度得到,然后进行降噪自编码器和迭代回翻训练得到翻译模型。方法在相近和不相近语言对翻译任务上进行测试,实验结果表明,使用双语词典和单语语料能有效提升低资源翻译质量。(3)为了提升低资源翻译模型性能,本文研究神经机器翻译中的系统融合方法。集成学习是机器学习中提高模型预测能力的常用方法,在机器翻译中一般被应用在解码阶段。本文将集成学习技术应用于模型训练过程,提出5种特征融合方法分别应用于N-1融合系统、N-N融合系统、1-N融合系统中。融合系统分别基于循环神经网络和注意力网络建模,并在汉语到英语翻译任务上测试了本文系统融合方法效果。实验结果表明,本文的系统融合方法能有效提升低资源翻译模型性能。本文针对机器翻译中领域低资源和平行语料低资源的问题,分别提出学习领域特征和利用双语词典、单语语料的方法来提升低资源翻译质量,最后研究神经机器翻译中的系统融合方法来提升模型的综合性能。
其他文献
目的观察不同剂量右美托咪定(DEX)对体外循环下(CPB)心脏瓣膜手术患者肺损伤的保护作用。方法择期CPB心脏瓣膜手术患者96例,按随机数字表法分为4组:c组、DEX1组、DEX2组和DEX3组,各2
将与质量传递有关的表面更新模型(surfacerenewalmodel)与微观涡流模型(eddycellmodel)引入到纳米材料的制备中,并通过自制两级反应器成功制备出粒径较小、结晶度较高的MgAl-CO3 L
国发[2017]49号 关于印发划转部分国有资本充实社保基金实施方案的通知国办发[2017]87号 关于印发消防安全责任制实施办法的通知国办发[2017]90号 关于创建“中国制造2025”
目的:研究长链非编码RNA(lncRNA)FAM83H-AS1在贲门腺癌组织及胃癌细胞系中的表达情况,并分析其表达与患者临床病理参数的关系。研究敲低lncRNA FAM83H-AS1后,对胃癌细胞系体外增殖、迁移、侵袭能力的影响。方法:1.使用实时荧光定量逆转录多聚核苷酸酶链式反应(Real-time quantitative polymerase chain reaction,RT-qPCR)的
中医药在卵巢癌恶性肿瘤的治疗中发挥着积极作用,本文分别从辨证分型、经典方药、常用中成药、单秘验方、针灸治疗五个方面对卵巢癌中医治疗的研究进展进行综述,发现中医药在
竖直地埋管的换热性能是影响地源热泵系统能源利用效率的关键因素,其热阻主要来源于地埋管周围的岩土。竖直地埋管周围地质情况复杂,竖向可能会穿越不同的岩土层,且部分岩土
渔业标准是渔业生产的重要指导性文件,渔业标准命名实体识别是构建渔业标准内容服务系统的基础工作,机器翻译、信息抽取、问答系统等相关工作都依赖渔业标准的命名实体识别任
过载保护系统一般安装于压力机的滑块内,主要用于压力机工作过程中过载保护,即工作时载荷超过额定载荷的100%—110%时的一种卸荷装置,同时,当压力机过载发生后过载保护系统能
目的:探求骨质疏松性骨折的临床治疗特点,为治疗措施提供依据.方法:回顾138例骨科因为骨质疏松性骨折就诊的患者的临床特点.结果:〉60岁,女性,骨密度降低以及跌倒次数是发生骨质
2007年,信托行业一法两规体系建立,信托公司的业务规模随之迅速扩大,2018年末其资产总额已达到23万亿元,业务规模仅次于银行业,在经济体系中发挥着越来越重要的作用。但与此