面向无监督多语言神经机器翻译的预训练模型研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:arigadordor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无监督神经机器翻译是一种仅使用不同语言的单语数据训练机器翻译模型的深度学习方法,它摆脱了神经机器翻译对平行语料库的深度依赖。本文集中于德、英、法3门语言之间的无监督神经机器翻译研究,利用德、英、法3门语言的单语数据训练多语言的无监督神经机器翻译模型。主要研究内容包括:(1)基于同一语义空间的无监督多语言神经机器翻译。本文探索了德、英、法3门语言各有1千万行互不相关的单语数据情况下的神经机器翻译,提出无监督多语言神经机器翻译模型。该方法仅使用1个模型训练了6项翻译任务。模型使用Transformer架构在3门语言之间两两建立翻译任务,3门语言各有1个编码器和1个解码器,共享编码器和解码器部分层,并在编码器后利用生成对抗网络预测当前编码语言的语种。(2)跨语言预训模型在无监督神经机器翻译的应用。本文主要研究现有无监督跨语言预训练模型中存在的不足,并针对其不足提出了几种改进方法。针对在预训练之后无监督神经机器翻译模型参数初始化质量不平衡的问题,本文提出二次预训练语言模型和利用预训练模型的自注意力机制层优化无监督神经机器翻译模型的上下文注意力机制层两种方法。同时,针对无监督神经机器翻译模型中反向翻译方法缺乏指导的问题,本文提出将Teacher-Student框架融入到无监督神经机器翻译模型中。(3)融合词典的无监督多语言预训练模型及其应用。受跨语言预训练模型和多任务学习的启发,为了研究不同语言之间语义结构的关联,本文进一步将跨语言预训练任务拓展到多语言中,提出了无监督多语言预训练模型。本文使用一个Transformer编码器作为多语言预训练模型,将德、英、法3门语言的单语句子及其译句拼接后作为多语言预训练模型的输入。并基于该预训练模型,进行无监督多语言神经机器翻译。基于公开评测的翻译WMT数据集,实验表明本文提出的模型能够明显地改善无监督神经机器翻译的性能。
其他文献
制造业企业是我国国民经济体系的重要组成部分,在发展经济、提升人民生活水平等方面发挥着重要的支撑作用。随着经济体制改革的不断深化,市场竞争愈发激烈,制造业企业如何在激烈的市场竞争中获得竞争优势、实现高质量新发展已经成为一个十分重要的课题。在制造业企业经营管理中,应高度重视成本管控工作,制定切实可行的成本管控目标与措施,提升成本管控水平,形成竞争优势,推动企业高质量发展。
期刊
脑干听觉诱发电位(brain-stem auditory evoked potentials, BAEP)可用于无法主动进行检查的患者,给无法交流的意识障碍(disorders of consciousness, DOC)患者提出较为客观的检查依据,并评估患者的意识水平。单独用BAEP预测DOC患者的预后有一定局限性。利用BAEP预测DOC患者的预后应考虑病变部位及致病因素的影响,且联合多模态的评
期刊
吡唑并[1,5-a]吡啶衍生物现在受到了相当多的关注,该结构是多种活性化合物的关键结构,这些化合物的生物活性主要表现在:可作为疱疹病毒抑制剂、多巴胺受体拮抗剂、p38蛋白激酶抑制剂、腺苷受体拮抗剂等。但是对于吡唑并[1,5-a]吡啶系列化合物在抗肿瘤活性方面的研究较少,由此我们把注意力放在了吡唑并[1,5-a]吡啶系列化合物抗肿瘤活性方面的研究。磺酰胺类化合物是具有广泛生物学应用的化合物,其中许多
学位
皮质醇(cortisol),是肾上腺皮质组织分泌的一种“压力激素”,对人体健康非常重要,其含量异常可诱发心血管病、库欣综合症、艾迪生病,甚至引起自杀行为。因此研究准确、快速和灵敏的皮质醇分析策略很有必要。将免疫分析和光电化学技术相结合形成的光电免疫方法已广泛应用于生物分析领域,具有响应快、简单经济、易于小型化、选择性高等优势。在光电免疫传感器的构建中,信号放大技术对改善检测灵敏度起关键作用。本文基
学位
<正>意识障碍是中、重型颅脑损伤(traumatic braininjury,TBI)的严重并发症。近十年来,随着神经多模态监测技术、大骨瓣减压术等手术理念的推广以及神经危重症医学技术的进步,重型TBI的病死率明显下降,但伤后意识障碍的发生率也在持续增加[1],临床治疗面临巨大的压力和挑战[2]。
期刊
<正>随着低碳环保理念日益深入人心,可重复利用的纸质包装逐渐成为产品包装的首要选择,并且基于纸材特点衍生出包装设计创意方法,有效提升了包装的美观性与艺术性,达到了实用功能与鉴赏功能的有机统一。在日益激烈的市场环境下,产品流通速度不断加快,人们对产品包装的审美要求显著提高,提高纸质包装的创意性成为包装设计的重要发展方向。而工艺美术作为美术化的手工艺术品,具有极高的艺术价值与文化内涵,能够为纸质包装设
期刊
癌细胞中的继发性耐药突变是对某些小分子抑制剂的反应。耐药突变可能以各种形式出现,这些突变不可避免地导致癌症复发。因此,新型抗肿瘤小分子抑制剂的设计和开发对癌症治疗具有重要意义。通过文献调研发现许多抗肿瘤小分子抑制剂都具有苯并含氮杂环结构,如吉非替尼,奥西替尼等。因此,本课题基于课题组中具有苯并氮杂环结构的化合物,评价其对表皮生长因子受体(Epidermal growth factor recept
学位
目的 探讨体感诱发电位(SEP)、改良昏迷恢复量表(CRS-R)及其联合指标对重症脑损伤恢复期意识障碍患儿的预后评价作用。方法 选取51例重症脑损伤恢复期意识障碍患儿为研究对象,所有患儿均在入康复中心时完成SEP检查和CRS-R评分,并动态追踪评估患儿意识水平变化,以病程满6个月、神志转清或死亡为评估止点。以患儿病程满6个月时意识恢复作为预后判断金标准,根据病程6个月内患儿意识恢复与否分为意识清醒
期刊
Ras蛋白含有一个C端Caa X基序,该基序指导蛋白质的翻译后修饰过程,其中Icmt催化C端异戊二烯半胱氨酸的最后一步甲基化。Icmt的抑制对细胞信号传导具有多重影响,这些影响最终导致细胞的死亡。这提示着人们Icmt可能是癌症的一个潜在治疗靶点,而对其抑制剂进行了大量的研究与开发。目前已报道了三类Icmt抑制剂:第一类抑制剂是基于底物S-腺苷高半胱氨酸为代表的化合物;第二类抑制剂是底物异戊二烯基半
学位
在党的十九届四中全会中,习近平总书记指出“重视发挥第三次分配作用,发展慈善等社会公益事业”。慈善捐赠作为企业社会责任的重要体现,受到学术界的广泛关注。一方面,慈善捐赠作为一种战略性投资工具,可以提升公司形象、获取融资便利、维护政企关系等;但另一方面,管理层会出于自利动机进行捐赠,用以谋求个人利益、提升个人声誉和社会地位。不同的捐赠动机是否会带来不一样的经济后果?近年来,不少进行慈善捐赠的公司做出背
学位