论文部分内容阅读
机器翻译是采用计算机进行自然语言之间翻译的过程。作为计算机语言学的一个分支,它的研究建立在语言学、数学和计算科学三门学科的基础之上,其效果的好坏也完全取决于这三方面的共同努力。随着互联网和信息技术的发展,机器翻译得到广泛使用,但译文质量不够高,仍很难满足用户的需求。 词汇和句法错误是导致译文准确性不高的重要因素,因此对译文进行系统的词汇和句法错误分析有助于提出改进机器翻译的方法。为了探讨新闻文本英汉机器翻译中的词汇和句法错误情况,本研究聚焦于三种常用翻译工具译文,关注各种错误类型的频率和典型表现形式。除此之外,作者还从语言学角度结合一定机器翻译原理分析导致错误的原因,从而提出改进机器翻译的建议。 本研究从《纽约时报》中搜集新闻文本,借助谷歌翻译、必应翻译和有道翻译输出译文,运行错误分类步骤确认词汇和句法错误类型并加以标注,使用SPSS21.0社会科学统计软件对错误进行翻译工具内和工具间的定量比较分析,并通过实例定性描述分析各种错误的典型表现形式。 研究结果表明,三种翻译工具在新闻文本英汉机器翻译词汇和句法错误上表现出很高的相似性。数据显示,22种错误类型均出现在三个翻译工具的译文中,词序错误、介词短语、多义词、动词短语误译频率最高;句法错误的频数均显著高于词汇错误频数,这是统计型机器翻译原理致使的结果;在词汇错误,句法错误总频数及19种子错误频数上,三种翻译工具不存在显著差别。除去相同点,作者发现翻译工具在词汇漏译、词汇多译和动词短语误译上存在显著差异,这归因于翻译工具的不同特点。本研究进一步统筹所有译文,描述分析各种错误的典型形式并对错误做出相应解释:一方面,英汉语言系统本身存在区别,并且中西方人不同的文化背景和思维方式会造成语言表达习惯上的差异;另一方面,翻译工具自身存在局限性,语料库不完善,脱离语境,缺乏语言学分析和短语切分不当。在此基础上,笔者针对错误提出一些改进建议并构想出一个翻译模型。