神经网络机器翻译系统质量评估——以谷歌翻译和搜狗翻译为例

来源 :南京大学 | 被引量 : 0次 | 上传用户:dejia2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络机器翻译(NMT)引入了单个编码-解码模型、长短期记忆及注意力机制等,性能达到最先进水平。大量关于NMT的研究在过去五年陆续开展,但主要集中在计算机语言学领域,过度关注该架构的技术细节,从翻译学角度开展的研究寥寥无几。目前的研究不足以为开发者和使用者提供一个针对NMT系统表现的客观描述。因此,本文以谷歌翻译和搜狗翻译两大基于NMT技术的翻译系统作为研究对象,探讨二者在信息型文本中译英方面的表现,主要回答以下问题:两款系统译文的可理解度如何,原文中不同语言特征对译文可理解度的影响如何?译文中有哪些典型的翻译错误?错误产生原因与NMT架构设计有何关联?研究选取三类体裁的信息型中文语料,有公开发表的英文译文作为评测参考,并以“可理解度”为标准对机器译文进行评测。研究重点分析两系统译文可理解度得分情况,归纳常见错误类型,并结合NMT架构的设计理念总结错误产生的根本原因,指出NMT的固有缺陷。研究发现,两款系统在翻译任务满足以下两点的情况下可产出完全可理解的译文:(1)原文词汇或词组搭配在翻译系统的训练语料中均可找到,且仅有一种对应译文;(2)原文和译文在句子结构上基本完全一致。然而,当原文中含有多义词、成语俗语、修辞、罕见词句、长句、歧义句或不完整句时,机器往往产出大致可理解或难以理解的译文。两系统的典型翻译错误分为准确度、流畅度和语言风格三类。准确度错误类型占错误总数一半以上,其中错译、命名实体和术语错误以及漏译最为突出;流畅度错误占错误总数的四分之一,其中语法错误和衔接不当是导致译文不流畅的主要原因;语言风格类错误比重最低,通常表现为不地道或蹩脚生硬的译文。错误产生的根本原因在于NMT依赖大量语料和算法进行训练,这一训练过程并未赋予翻译软件人的智力,以学习分析和理解文本所需的相关语言知识、常识和领域知识。翻译系统仅通过数学计算得出各个候选译语词的概率,进而挑选概率最高的词作为输出,并按照训练过程中所学的句子或短语结构将输出词组合成译文,但系统无法判断该译文正确与否;其次,机器语料有限,在处理集外词(out-of-vocabulary word)或非常见句型时,NMT无法在语料库中找到相匹配的语料进行输出;再次,NMT系统不够稳定,其长短期记忆和注意力未能有效进行信息记忆和文本对齐,以提供实用上下文信息,减少长句漏译。未来研究者可通过扩大词表或训练语料库等方法提高NMT性能,但这些方法仅能减少部分错误产生的频率,仍无法杜绝错误产生。要想根除机器翻译错误,相关研究者须了解语言学、翻译学和神经科学等领域知识,以探寻专业人类译者如何开展翻译工作,并试图建立起一套能够模拟该认知过程的机器翻译架构。翻译机器只有拥有了想法、情感和经验,才可理解原文,并产出准确、流畅且与原文风格一致的译文。但若当前技术无法实现这一目标,则需要研究者客观看待NMT,了解其能与不能,从而有针对性地采取切合实际的改良措施。
其他文献
信息时代,数据的重要性不言而喻。部分事业机构和企业单位,将生产发展过程中获取和产生的数据向公众开放,以此促进数据的使用和开发,更有部分机构通过开放数据竞赛的形式,激励公众参与到数据的开发利用中来,征集具体问题的解决方案、挖掘数据价值。目前,开放数据竞赛已在公共管理、教育、商业、数字人文等领域诞生了一定的优秀作品,以图书馆为主的公共文化机构,拥有海量而富有特色的数字人文资源,在数字人文领域的开放数据
学位
近来,国家大力提倡发展“互联网+医疗健康”,一时间内大量互联网健康服务网站如雨后春笋一般出现在大众视野中。互联网普及率的全面提升不断为传统医疗健康行业赋能,大量用户在无法确认自身健康状况时倾向于求助互联网进行疾病自诊。然而,由于用户普遍存在医疗保健知识匮乏、信息甄别能力弱等问题,因而在面对数量多、传播快、质量良莠不齐的在线健康信息时容易对自身健康状况产生错误的看法,夸大患病的可能性,进而导致更为频
学位
心血管疾病问题给我国居民带来极大困扰,病人需要去医院做心电图检查来确认心脏的健康状况。随着移动医疗以及可穿戴技术的发展,人们在日常生活当中也可以采集心电信号,提交给远程医生诊断。伴随着可穿戴设备的普及,产生的心电数据数量规模不断增大,现有的诊疗方式由于资源有限,使得医生的工作负担较重。因此需要开发一个系统来满足对大量的心电数据的快速处理和管理,辅助医生诊断,提高医生的工作效率,从而为患者提供更快捷
学位
黄飞鸿电影是迄今为止世界电影史上延续时间最长、拍摄数量最多的一个系列。界定这一流行故事母题就是要识别它作为一个连贯的且带有独特价值观念的叙事系统的地位,笔者旨在把百余部黄飞鸿电影组成的整个系列作为研究对象并深入探讨其中体现的民族主义叙事,实现这一点首先要厘清这一系列自身的流变及与香港电影工业的互动。古典的黄飞鸿电影起源于清末的广式武侠小说,直到1949年才被胡鹏导演搬上银幕,这部黄飞鸿电影获得了商
学位
“黑车”作为一种“非正式经济”,他们依靠“非正式”的管理和揽客群体、“非正式”的营运模式和制度,构建起了一个灵活经济的关系网络,给人们提供了大量的出行服务,冲击着所谓的与其相对的“正式经济”,并面临着后者的打击。但本文的田野向我们展示了一幅“黑车”的运营逻辑和关系网络与“正规客车”高度相似甚至相互借鉴、相互亲和的图景。本文认为无论是黑车还是其背后的“非正式经济”都绝非一个天然固有的范畴,而是一个带
学位
公安位于长江中游南岸,隶属湖北省荆州市,方言属西南官话湖广片湘北小片。前人对公安方言研究较少,且集中于语音层面。本文将从语法层面入手,全面细致地描写公安方言语气词,采用田野调查法、比较研究法、方言地理学等方法,分析公安方言语气词单用和连用的情况,与武汉、长沙等周边方言语气词进行对比,并追溯公安方言特色语气词的来源。全文共分为五章:第一章介绍公安地理历史概况,阐述公安方言研究现状和语气词的概念、分类
学位
随着社会经济发展、科技进步,人类进入大数据时代,数据作为“未来的新石油”已成为信息社会的重要财富。政府在履行政府行政职能、管理社会公共事务的过程中会采集、生成、公开所获取到的数据资源。这些数量庞大的政府数据渗透在社会生产生活的各个方面,如何将其整合、合理开放以及能最大限度地被公众有效利用成为当前政府数据治理的一项重要议题。在这一背景下,政府开放数据的评估显得尤为重要,而可用性体现了判断政府开放数据
学位
随着信息技术的高速发展和数据密集型研究方法的深度实践,数据分析方法与出版的结合日益紧密。在数据分析技术影响下的出版业,其看待问题的角度将更为多元,统筹全局的视角将更为广阔。数据分析为出版业的流程与实践革新提供了新视野和新动力,同时也为出版研究打开了新的大门。就目前的研究现状来看,国内外围绕出版研究中的数据分析方法使用的研究成果非常少,出版领域研究方法向数据科学方向转化的意识刚刚萌芽,正处于对各种数
学位
远藤周作作为日本基督教文学家的代表性人物,其创作风格在“第三新人”作家中独树一帜。自我凝视和对人类的凝视是远藤文学的重要特征。其信仰的基督教是母亲与伯母强加于身上的“不合身的洋服”,将这件洋服翻改为“合身的和服”是他文学的出发点。“基督教信仰是不断的改宗”,则是他的宗教理解。在学术界,中日两国关于远藤文学的研究成果存在明显差异。日本学界成果较为丰富,角度多样;中国学界则对其关注较少,以个别作品分析
学位
本文以南京博物院瓷器名称英译为例,运用社会符号学翻译法,探索如何准确翻译文物名称,以确切传达文物名称的历史文化内涵。文物是人类珍贵的历史文化遗产,是人类社会发展的重要见证。文物名称提供文物基本信息,为传播中国文化、帮助母语非汉语游客了解中国文物,中国越来越多的博物馆将文物名称翻译成英文。文物名称翻译成为翻译研究的重要议题,翻译研究者和博物馆工作者均对此进行了广泛讨论,并提出了文物名称英译的规范、原
学位