【摘 要】
:
机器翻译作为一个备受瞩目的研究课题,经历了从规则的机器翻译到基于统计的机器翻译,并取得了令人瞩目的效果。随着大数据的兴起,深度学习也应运而生,为机器翻译带来了新的技术和方法,神经机器翻译在大规模语料的训练下的翻译效果已经达到了很高的水平。基于深度学习的机器翻译利用非线性网络模型进行序列间的转换,但仅仅依靠神经网络进行自然语言间的转换存在两点不足:(1)神经机器翻译在大规模语料支持下的翻译效果才好,
论文部分内容阅读
机器翻译作为一个备受瞩目的研究课题,经历了从规则的机器翻译到基于统计的机器翻译,并取得了令人瞩目的效果。随着大数据的兴起,深度学习也应运而生,为机器翻译带来了新的技术和方法,神经机器翻译在大规模语料的训练下的翻译效果已经达到了很高的水平。基于深度学习的机器翻译利用非线性网络模型进行序列间的转换,但仅仅依靠神经网络进行自然语言间的转换存在两点不足:(1)神经机器翻译在大规模语料支持下的翻译效果才好,尤其是在特定领域内语料较少的情况下翻译效果不佳。(2)神经机器翻译在针对一些特定领域内进行建模时没有学习到领域内的知识。针对以上问题,本文面向专利文本总结出了框架、术语、常用语等领域知识,分别使用了数据增强和对语料进行标注的方式来解决。本文基于数据增强的方法,利用翻译模板的思想,识别并抽取出句子中的名词或术语,保留句子的主干。然后通过将抽取出的术语集合在句子主干框架上进行重组之后生成伪平行语料。最后通过计算句子的困惑度来对生成的伪语料进行选择,生成质量较好的伪语料。该方法有效的缓解了神经网络因为语料不足而导致模型的泛化能力不足的问题。实验结果表明,该方法获得的译文与基线系统相比,BLEU值提升了2.32。本文针对专利文本进行翻译,使用了拼接、替换两种标注方式对训练语料中的领域知识进行标注,将框架知识、短语知识及术语知识作为内嵌注释分别融入到了翻译模型当中去,并通过设计对比实验证明了该方法的有效性。实验结果表明,该方法获得的译文与基线模型相比,中英和英中模型的BLEU值分别提升了 1.28和2.08个点。最后,集成本文提出的两种方法,设计并实现了英中神经机器翻译系统。并与基线模型相比,翻译质量得到了有效的提升。实验结果表明,本文提出的两种方法可以有效的提升神经机器翻译的翻译质量。
其他文献
在艺术创作中,画面的情感表达是基于对社会生活的体悟,在现当代的绘画领域中艺术作为多元化、多样化的形式存在,而创作的情感大多都是基于创作者本身的环境和社会形态。在本篇论文中主要以《万物之声》系列为主,突出环境问题作为本篇论文的出发点,以黑白木刻中刀法运用和笔者主观情感来呼吁环境问题,引发观者的共鸣。本篇论文通过以下部分来阐述:第一部分,讲述《万物之声》创作的来源、目的及创新之处;第二部分,介绍前人如
随着二十一世纪机器人学的兴起,以及国家十三五、十四五的规划重点项目中提出推动人工智能技术在各行业的发展,要大力发展机器人在工业、军用和服务等领域中应用,机器人的研究已经在快速发展。2018年到2021年更是迎来了高速的增长,随着各个领域的高新技术的提升和核心部件制造技术的不断进步,服务机器人需求潜力巨大,市场中的应用场景不断扩展。其中在公共场所、机场车站、社区和家庭的服务以及在2019年抗疫中的医
阅读是学生学习英语的必备技能。良好的阅读能力和阅读兴趣对学生的英语学习具有重要意义。但受应试教育的影响,在目前的初中英语阅读教学中,教师更加注重语法、词汇等语言知识的教学,常采用注入式的教学方法,忽视了阅读文本的深层意义,致使学生的阅读能力和阅读兴趣不高。因而如何以有效的方式调动学生的阅读兴趣、提高学生阅读能力,是现在一线教师和研究者需要解决的问题。“阅读圈”模式秉承以学生为中心的教学理念,能够提
亲子关系是人生中形成的第一种人际关系,也是家庭中最基本、最重要的一种关系。小学阶段是个体身心发展的关键时期,良好的亲子关系为以后的成长打下坚实的基础。处于小学阶段的学生身心发展具有不成熟、不稳定等特点,随着时代的快速发展,他们的思想观念与父母之间的差距越来越大。在他们进入中年级以后,课程的增多,课业负担的加重这些因素都会造成他们与父母之间矛盾的频发,冲突的增多,使得他们之间的亲子关系紧张,进而影响
企业民主管理制度是我国基层民主政治建设的重要内容,是社会主义民主制度的组成部分。在社会主义国家,人民当家作主不仅要实现全体人民的政治权利,还要实现人民群众的经济权利和社会权利。工人阶级和劳动人民只有在生产活动和社会活动中实现了自己的权利,其民主权利才有坚实的基础。新中国成立以来,在党和国家的高度重视下,以职工代表大会为主要形式的企业民主管理制度不断发展和创新。在中国特色社会主义新时代,健全充满活力
目的:应用体素内不相干运动(intravoxel incoherent motion,IVIM)成像评估原发性肾小球疾病(primary glomerular diseases,PGD)肾脏弥散和灌注变化情况,探讨IVIM定量参数与估算肾小球滤过率(estimated glomerular filtration rate,e GFR)的相关性,以及IVIM对原发性肾小球疾病的轻、中、重度肾功能受损
高校书店是校园重要的人文地标,是建设学校精神文明的重要阵地,它承载着传承文明、推进素质文化教育的重要功用,是校园文化重要的组成部分。国家有关部门十分重视高校书店的建设,制定了一系列的扶持政策,掀起了高校书店建设的热潮。但新涌现的高校书店在空间设计上往往照搬社会书店模式,形成了千校一面、文化底蕴缺失的问题。校园文化是一所高校的精神坐标与灵魂基石,它集中反映着高校的一切特征、规划和发展的需求,以校园文
随着工农业的快速发展以及人类活动的加剧,水体硝酸盐污染日趋严重,特别是与人类生存和生活紧密相关的地下水污染,引起越来越多人的关注。地下水中硝酸盐(NO3-)含量超标会对人类健康和自然环境产生巨大威胁。如何有效修复地下水中硝酸盐污染,发展绿色高效的硝酸盐去除技术,一直是水污染控制与修复领域的研究重点。目前去除水体中硝酸盐的方法主要有生物反硝化脱氮法、物化法、活泼金属还原法和光催化还原法。其中光催化法
在当前这个互联网大数据时代,各种网络新闻资讯的获取也越来越容易,新闻资讯的更新速度也越来越迅速。基于新闻的时效性,很多新闻资讯都以时间序列为主要的叙事方式,因此在展示新闻内容和新闻线索的时候,时间线就成为了用户与新闻交互中很重要的一环。每当有重大新闻事件发生时,相关的跟踪报导的时间跨度很长,在同一时间下又有多家媒体会对此新闻进行报导,最后导致新闻信息重叠,造成信息获取过多和时间的浪费。因此对于用户
作为城市空间的一个重要组成部分,见证了城市的发展,老旧的街区在经历了漫长的岁月之后,逐渐衰落,但是它自身却有着深刻的意义。如何找到一种合理的方式来进行老旧社区更新,同时解决社会矛盾,实现经济和文化的复苏,以及促进城市的进一步发展已经是大趋势。文章通过对国内外城市邻里更新和社区邻里的有关问题进行了研究,得出了对城市社区空间与邻里关系的相关性的研究比较少。文章运用了城市建设艺术理论、城镇景观理论、外部