谷歌神经机器翻译系统质量评估研究 ——以《孤独星球欧洲》的汉译为例

来源 :贵州民族大学 | 被引量 : 0次 | 上传用户:netuu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自工业革命以后,人类快速发展成为现在繁荣的景象。现在,人类面临着另外一场革命“智能革命”。人工智能(AI)的迅速崛起,在各行各业掀起了新一轮的革命。AI时代已经来临,作为跨语言交流的核心,语言翻译服务的需求随着世界经贸文化的发展在急剧增加,传统的翻译已经很难满足规模化的翻译需求。信息技术和计算机硬件的发展推动着机器翻译的发展。许多组织正在以机器翻译(MT)的形式来降低翻译成本,启用了基于神经网络的AI的自动翻译,在过去的两年中在准确性方面取得了巨大飞跃。其中典型的代表是谷歌翻译。2016年9月,谷歌上线了新的在线翻译平台GNMT来取代以前的统计机器翻译(SMT)。GNMT基于端到端的翻译学习方法,英法德等西方主流语言的翻译准确率达到了90%,中英互译准确率则80%左右。近几年,谷歌翻译每天提供数百万次跨语种的翻译,每月有将近10亿用户使用。但是,真正了解其内部工作原理的人数要少得多,其翻译质量也很难去评估。本文探讨GNMT在旅游文本英译汉翻译中的问题,发现了机器翻译在翻译特定文本中存在的一些主要问题,并针对翻译结果提出一些建议。本文先简要回顾机器翻译发展历史与谷歌神经网络机器翻译的产生与发展演变,并评估使用GNMT技术进行旅游文本英译汉的可行性与实用性;之后讲述了机器翻译评测的类型与发展,新的神经网络机器翻译系统极在流畅度和可读性两个方面大大超越了以前的统计机器翻译,但由于算法偏向的问题,过度追求流畅度可能会降低译文的忠实性。GNMT针对统计机器翻译的基于N-gram匹配的BLEU值进行优化,在评分上可能很高,但实际译文质量很难保证与评分相同,这就需要搭建新的立体化的评价体系。然后对本论文测评对象lonely plane--Europe中的旅游语篇进行介绍和文本类型分类;在DQF动态评估理论的框架上,结合世界机器翻译大会(WMT)对机器翻译质量评估的研究,建立起一套基于DQF动态理论的机器翻译快速评估框架,对主流翻译系统——谷歌翻译译文首先进行整体可读性评估,然后再从语言、术语、准确度三个层面上进行译文错误分析错误并尝试回答以下三个问题:(1)作为通用机器翻译系统,GNMT对限定文本英译汉的质量如何?(2)面对特定文本,GNMT英汉翻译常出现的典型错误有哪些?(3)针对这些典型错误,GNMT的改进措施有哪些?分析结果显示GNMT译文在针限定文本和目标用户的情况下,可读性评估得分为83.8分,在使用者的可接受范围内。典型错误主要集中在术语翻译不准,没有对未登录词进行有效的处理;在准确度方面,主要出现的错误是多译、漏译、错译三个方向的问题;语言方面主要出现的问题是在句法上面,句子成分与搭配问题上,出现语句不符合汉语语法习惯。GNMT应当进一步提升对自然语言的识别和理解能力,采用新的算法和限定机制,并运用部分语言学知识进行输出优化,以接近或达到人工翻译的水平。
其他文献
漢譯佛典是中古漢語詞彙史研究必不可少的材料,《金光明經》作爲大乘佛教最具影響力的經典之一,因其宣揚懺悔滅罪、護國利民等思想,流傳廣泛,影響深遠。從語言上來看,梵文原典被翻譯成漢、藏、回鶻、西夏、蒙古、于闐、維吾爾等多種文字;從漢文版本來看,自北涼時期至唐代先後產生6種漢文譯本;從漢文本傳世情況來看,其中3種譯本經過一千多年的輾轉傳抄,形成了眾多版本,包括房山石經、20餘種漢文大藏經、2000多號敦
新时期下,新教改和新课改正如火如荼的进行,2016年以来,民办教育企业因管理不善、良莠不齐等问题受到社会、国家层面的高度重视,特别是学前教育及素质教育领域,一系列政策的连续出台,在原先备受资本青睐的教育板块引发了“地震”,全国教育板块的格局发生了本质性的变化,线上教育企业开始异军突起,并普遍在A轮获得丰厚的投资。与此同时,二胎政策的开放和区域教育资源的不平衡催生了新形式的教育方法。高速发展的信息化
随着5G技术的普及将会给社会发展带来一系列的变革,无人驾驶汽车也出现在了社会的视野之中。目前许多国家都开始对无人驾驶汽车进行研发,并且已经取得不菲的研究成果,无人驾驶汽车的出现给人们带来便捷的同时也带来了许多新的挑战。本文主要着手于无人驾驶汽车犯罪中的犯罪主体以及责任分配进行讨论,第一章主要简单介绍了无人驾驶汽车的概况,无人驾驶汽车分类等级,以及国内外关于无人驾驶汽车的立法现状,从国外立法现状中寻
本文是一篇翻译项目报告。翻译项目的原文选自论文集《探索悲伤——走进悲伤社会学》(Exploring Grief--Towards a Sociology of Sorrow)中的第四部分-第十二章“个体化社会中的悲伤:诊断文化进步的关键”(“Grief in an Individualized Society:A Critical corrective to the Advancement of
语言学家认为,澳大利亚是一个天然的语言实验室(Fritz,2007)。英国在澳大利亚建立殖民地之时,派遣了大量来自英国各地的囚犯。这些移民虽然都说着一口英语,但是他们的地域或者社会方言却千差万别。到了全新的社会环境中,囚犯们经历了共同的生活,将他们自己家乡的、阶层的、团体内部的概念结构不断进行改造,运用一定的社会认知机制,逐渐达成主体间性,形成了独具特色的监狱用语;随着这些用语向外的不断传播,成为
本篇翻译报告原文节选自迈克尔·T·史蒂文斯(Michael T.Stevens)的《心理战艺术》(The Art of Psychological Warfare)。该书共有六章,探讨了如何赢得心理战以获得更好的人际关系。在本报告中,译者选取第一章、第二章和第三章为翻译章节,这三章分别介绍了心理战历史,如何读懂他人以及如何受人喜欢。原文属于信息型文本,以传达信息为主要目的。在翻译中,译者以卡特福德
近年来,管理教育培训行业面临的竞争异常激烈。一方面,该行业进入门槛低,管理教育培训市场鱼龙混杂;另一方面,市场细分程度不断加大,客户需求多样化。市场竞争格局与客户需求的变化迫使管理教育培训业务开展方式随之调整,由原来以“以知识传授为主导,学员被动接受”的模式,转变为“以能力提升为中心、学员主动探索式学习”的模式,符合并且满足客户需求的企业才会有长远发展。本文研究对象为X公司管理教育培训服务的商业模
关于教师胜任力的研究以往大多集中在高等教育、职业教育、成人教育、特殊教育以及初等教育,对农村幼儿园教师胜任力的研究较为缺乏。近年来国家在学前教育领域陆续出台许多政策,提出切实办好新时代学前教育,推进学前教育事业科学发展。而幼儿园教师素质高低是办好学前教育、提升教育质量的关键所在。农村幼儿园教师的岗位胜任力关乎农村学前教育发展的质量与水平,开展农村幼儿园教师的胜任力特征画像研究,给幼师专业发展提供合
员工持股计划是企业所有者向员工分享企业所有权和未来收益权的一种激励制度。自证监会发布《关于上市公司实施员工持股计划试点的指导意见》后,实施员工持股计划的公司数量出现大幅度增加,截止2019年6月,共有661家A股上市公司推行了888个员工持股计划,但是目前我国员工持股计划大多并不完善,有一部分企业的员工持股计划最终以失败收尾。由此可见,分析失败案例并提出有效建议十分必要。本文以生物质发电行业领先企
在这个信息全球化的今天,随着传媒技术的发展和人们娱乐需求的旺盛,媒体奇观成为了社会上普遍的文化现象。近年来,随着我国体育产业的快速发展,竞技体育逐渐走向商业化、市场化的道路,在此期间,许多商业体育赛事涌现出来,成为了媒体制造奇观的主要生产场域,武术搏击赛事也不例外。武林风赛事作为国内商业化武术搏击赛事的代表之一,在消费社会背景下,媒体通过与武术搏击赛事结合,利用各种媒介化手段,不断的制造搏击明星、