论文部分内容阅读
随着深度学习在机器学习领域中的发展,基于深度学习的神经机器翻译方法在机器翻译系统中得以成功运用。2016年,神经机器翻译迅猛发展,性能超越统计机器翻译,成为以谷歌翻译为代表的商业翻译系统的核心技术。机器翻译和机器翻译评测的发展相辅相成,机器翻译的发展推动了机器翻译评测的进展,机器翻译质量的评估又可以反过来促进机器翻译的发展。机器翻译评测一般分为人工评测和自动评测两种手段。近年来,自动评测技术层出不穷,以满足不同模型的评测需求。人工评测则因为评测成本高、难度大、主观性较强等因素,其发展受到制约。但人工评测的优势仍不可忽视。自动评测主要衡量的是机器翻译结果的优劣,而人工评测不仅可以评估翻译结果的优劣,还可以从语言学的角度发现翻译结果存在的问题并探究其原因,为机器翻译质量的提升寻找突破口。目前,对于以神经机器翻译为核心的英汉机器翻译系统的人工评测研究成果不多。而且从研究来看,评测的侧重点多见于词汇层、短语层、句法层和篇章层,鲜有人涉猎小句复合体层面的英汉机器翻译评测。作为语言分析的基本单位,小句的长度介于短语和句子之间。小句复合体内小句的组建方式有其独特的规律,与句子内短语、篇章中句子的组建方式不同。随着基于NT小句的英汉小句复合体理论的初步构建,本文尝试从小句复合体层面针对性地观察英汉机器翻译中在该层面上存在的困难。本研究旨在根据小句复合体理论的指导观察机器翻译系统英译汉结果的小句复合体层面的错误类型及其分布,并探讨英汉小句复合体结构差异对机器翻译的挑战,由此提出以下三个研究问题:第一,机器翻译系统英译汉结果中存在的小句复合体层面的错误有哪些类型?第二,小句复合体层面的各个错误类型的分布情况如何?第三,对造成英汉机器翻译小句复合体层面错误有影响的英汉小句复合体的结构差异有哪些?论文采用定性与定量结合的研究方法。作者随机选取宾州树库中的华尔街日报的20篇新闻为翻译原文,将其切分为497个英语句子,再以句为单位输入谷歌、百度、搜狗和小牛等四个主流在线机器翻译系统中以获取机器翻译汉语译文,这一工作在2017年1月开始,完成于同年7月;然后分别采用换行缩进的图式呈现原文与译文的话头和话体关系,进而标注机器翻译英译汉结果的小句复合体层面的错误,最后进行错误类型的统计和分析。本研究发现,英汉机器翻译结果的小句复合体层面的错误主要包括与上下文相关的词语错、话头-话体关系错、逻辑错和引用错四大类型。据数据统计,平均两个英语句子中就有可能出现一处小句复合体层面的错误,而且话头-话体关系错尤为突出。这与英汉小句复合体的话头共享关系结构差异和逻辑语义关系结构差异有着密不可分的联系。本研究在小句复合体理论的指导下观察英汉机器翻译译文的错误,揭示了英汉机器翻译译文在小句复合体层面上的错误类型及其分布,同时对可能造成这些错误的英汉小句复合体的结构差异进行分析,以期指明目前以神经机器翻译为核心的英汉机器翻译在小句复合体层面的的困难之处,为改进英汉机器翻译的质量提供参考。