论文部分内容阅读
【摘要】随着科技的进步,语言服务市场逐渐蓬勃发展,翻译的工作形式也发生了很大变化,译后编辑也成了一种新兴的职业。本文通过实际案例分析了常见的三种译后编辑环境特征,包括文字处理软件、计算机辅助翻译工具以及专业译后编辑工具,并对比了三者的异同,最后在使用及优化方面提出了一些建议。
【关键词】机器翻译;译后编辑;计算机辅助翻译
【作者简介】秦国强,对外经济贸易大学。
引言
近年来,有关机器翻译的新闻在社会上引起了人们的广泛关注。以“机器翻译”为关键词在中国知网(CNKI)进行检索,可检索到5000多条结果。翻译软件层出不穷,以有道翻译、谷歌翻译等为首的主流翻译工具在人们的日常生活中发挥着越来越重要的作用。尽管如此,机器翻译的质量仍存在不少问题,英国著名语言学家John Hutchins(2003)曾指出:“机器翻译译文质量至今并没有取得实质性进展,50多年前未解决的很多问题如今依然存在。”这种背景下,新型的译后编辑应运而生,逐渐成为一种流行的翻译模式。那么译后编辑到底是什么?译后编辑的操作平台有哪些?不同的译后编辑环境之间有何差异?基于这些研究问题,本文将从实际案例出发,着重讨论三种不同译后编辑环境特点、作用,并对译后编辑的优化提出一些建议。
一、译后编辑概念解读
国外有关译后编辑的研究较早,在中国起步相对较晚。SDL所发布的译后编辑白皮书中,引用了其机器翻译项目首席科学家Daniel Marcu 对译后编辑的定义,即“译后编辑是指语言专家对机器翻译输出的译文进行编辑以生成人工质量翻译的流程”(SDL,2013)。ISO 17100于2013年发布的报告中,认为译后编辑是“检查和修正机器翻译的输出”。根据译后编辑的目的和程度,译后编辑还被分为“完全译后编辑”和“非完全译后编辑”(ISO,2015)。
关于译后编辑的概念,崔启亮(2014)综合了Allen(2003)等学者的观点,并基于翻译市场不断发展的现状,将译后编辑分为“狭义的译后编辑”和“广义的译后编辑”。该定义充分考虑到了翻译环境的变化以及翻译技术工具在翻译中的作用,不再单纯地将机器翻译译文作为编辑的对象,而是将机器翻译、翻译记忆库与人工翻译等相结合进行考虑。本文中所述的译后编辑环境既涉及广义的概念,也涉及狭义的概念,在论述中会有所区分。目前,译后编辑工具的整体使用比例已经达到了71%,对机器翻译及译后编辑的业务的需求也排到了第4位(中国翻译协会,2018)。随着OCR、机器翻译、语音识别及计算机辅助翻译软件的兴起,纯人工参与的翻译行为将越来越少,取而代之的是不断成熟的翻译自动化流程。
二、三类不同译后编辑环境的特点分析
一般来讲,译后编辑的环境主要有三种:1.文字处理软件;2.计算机辅助翻译工具;3.专业译后编辑工具。其中,常见的文字处理软件包括微软公司的Word,利用修订模式可对译文进行人工修改。计算机辅助翻译工具内部一般都嵌入了译后编辑平台,操作流程更加具有连续性,如Trados、memoQ等。而专业的译后编辑软件更加个性化、专业化,符合特定人士的需求,功能也更加强大,如翻译自动化用户协会(TAUS)发布的动态质量框架(DQF)。接下来本文将逐一对三种译后编辑环境进行分析。
1.文字处理软件中的译后编辑——以微软Word为例。Word是当下使用最广泛的办公软件,在文字处理方面具有很丰富的功能。而对译员来讲,Word中有很多与翻译辅助相关的功能,比如利用Word制作双语对其文档、使用Word宏功能进行快捷操作、通过查找替换进行翻译的校对等。而Word中的修订模式对译后编辑具有很大的帮助,能基本满足大多数人对翻译审校的需求。
(1)Word中译后编辑前的材料准备。在Word中获取需要編辑的译文有两种方法。第一种是借助免费的机器翻译工具如谷歌翻译、有道翻译等,通过复制粘贴的将译文转移到Word中;另一种是借助Word中的翻译插件(如有道翻译)直接进行译文生成。两种方式各有优缺点,采用译文转移方式进行译后编辑,需要不断重复复制粘贴,无法批量处理待翻译材料,但这种方法完全免费。而采用Word内嵌机器翻译引擎,可批量对源语进行处理,实现一键翻译,并且可直接将译文另存为docx文档,优化了翻译流程,但该方式需要译者支付一定的费用。
(2)Word译后编辑的流程。获取机器翻译译文后,译文修改之前,译者需要为译后编辑创造一个较为便捷的编辑环境。由于Word文档功能有限,无法自动生成双语对照的文字,不做处理的情况下译者编辑时效率较低。此时可对原文译文做编辑前的格式设置,将双语部分制作成段落数相等的两部分,采用文本转化成表格功能,可时文章分成左右对照的两部分,大大方便了译者对译文的修改方式。大致流程如下(如图1):
1)处理双语材料,调整段落使其完美对照;
2)全文选中,将文本转化成两列的表格;
3)开启修订模式,进行译文修改,确定最终译文;
4)将表格转化成文本,保留最终结果。
该方式对于一般性的译文修改效率较高,Word中的批注功能也可以很好地起到备注作用,对于译文疑难点、争议点都可以进行备注,方便后续译文审校。从上文探讨的定义上看,该译后编辑属于狭义上的译后编辑。
(3)Word译后编辑环境优劣分析。从整个操作流程来看,Word环境中的译后编辑使用起来较为简单,对低要求、专业性不强的小型翻译项目是一个不错的选择。另外,软件简单易用,获取方法便捷。作为一款文字处理软件,它对于文字的处理较为强大,但也正由于软件自身的局限性,并非所有的材料都适合进行译后编辑。例如,包含众多图片的docx不适合此方法,除docx格式以外的其他文档如xml、ppt、pdf等也不宜采用Word修订功能。此外,对于高质量、高要求的大型翻译项目,由于字数较多,包含术语复杂,用Word处理显然是远远不够的。 2.计算机辅助翻译工具中的译后编辑——以memoQ为例。计算机辅助翻译工具(Computer-aided Translation,简称CAT)是指专为提高翻译效率、优化翻译流程而设计的专门的翻译辅助软件,包括翻译记忆系统、术语管理工具、对齐工具和项目管理工具等(徐彬等,2007)。计算机辅助翻译工具重在“辅助”,并不完全非完全依靠计算机本身产出译文,这与机器翻译具有本质的差别。由于具有强大且完整的翻译体系,CAT软件能够进一步帮助人们实现更加多样化、复杂性的译后编辑环境。
(1)memoQ中译后编辑前的材料准备。首先需创建翻译项目。在利用memoQ进行文档导入时,有许多专业术语,导入了术语库,还可建立翻译记忆库。由于memoQ可进行预翻译功能,且翻译结果是由多个来源决定的。可以使用记忆库资源,若记忆库不匹配或者匹配度较低,则可选择自动调用机器翻译,其中机器翻译可根据译者需求进行接入。如图2所示,该页面即为原语通过记忆库和机器翻译双重处理后所生产的待编辑译文。因为翻译整合了翻译记忆等功能,在集成翻译环境下经过人工操作输出最终译文,这种译后编辑可以称为广义上的译后编辑:
(2)memoQ译后编辑的流程。译者所要修改的内容来自机器翻译内容和模糊记忆的匹配,这虽然在某种程度上降低了译员的认知努力,但同样需要译者根据不同匹配度对译文做出不同程度的修改。与单一的Word翻译平台不同,CAT软件大多内置质量保证工具。因此,在进行人工校对时,可初步由机器检测出有哪些明显错误需要修改。由于大型项目翻译文档复杂多样,且有很多格式上的要求,因此一些错误仅凭肉眼无法识别,需要借助质量保证工具进行预修正。质量保证工具可检查格式缺失、术语不一致、漏译、数字错误等质量问题,这对译员进行快速定位错误具有重要作用。memoQ中的跟踪修改功能设计也比较强大,可以很直观地向译者展示整个修订过程,并且还可及时更新翻译记忆库,具有提升翻译效率的作用。
(3)memoQ译后编辑环境优劣分析。与Word相比,memoQ在接入机器翻译基础上,还调用了翻译记忆库,机器翻译与记忆库的整合不仅降低了成本,也整体提升了译文的质量。同时,对于较为复杂格式的文本,memoQ也可以最大化地保留,降低了后期大量的排版时间。从技术层面上看,memoQ在译后编辑中已经取得了很大的进步,但是在术语等层面还有提升的空间,比如如何保证在预翻译过程中术语的一致性,如何实现机器翻译(译后编辑)与翻译记忆的有机融合,充分发挥两者的作用,构建一个集成化的友好翻译平台(冯全功、崔启亮,2016)?翻译记忆匹配值过高或者过低都无法充分发挥机器翻译或者翻译记忆的优势,这也是将来技术开发人员需要考虑的一个方向。
3.专业译后编辑工具——以TAUS DQF为例。除了较基础的Word审校工具以及功能全面的CAT译后编辑平台,还有一些定制版的译后编辑工具。目前翻译市场上定制化的译后编辑工具多种多样,也更加满足翻译公司内部的实际需求。本文将以TAUS发布的DQF工具为例,简要探讨其在译后编辑方面所起的主要作用。
(1)TAUS DQF中译后编辑前的材料准备。DQF是一款嵌入SDL Trados中的插件,译者可通过该软件计算编辑距离,即指两个字串之间,由一个转成另一个所需的最少编辑操作次数,用来比较译后编辑和机器翻译初始译文之间的变化。这种方法可用来计算译后编辑人员为使译文达到某种质量要求所付出的努力,也可用来评估机器翻译的质量,而在此我们主要分析其在译文审校编辑过程中的作用。根据DQF的使用指引,在Trados中需先创建好项目,随后将项目添加到DQF中,进而创建项目文件包。同理,可按照类似memoQ的译前处理方式对材料进行预翻译,得到初步译文。
(2)TAUS DQF譯后编辑的流程。DQF Dashboard可以捕捉译者在Trados中的翻译信息,显示在某个时间段里译者翻译的句段数、字数、所耗时长等,该面板为在线网页,如图3所示。同样,在审校时需要创建审校包,在主界面就会显示该项目的有关信息。在这种环境下,之前的翻译数据清楚可见,其中译文更正数量、注释数量、审校设置、翻译和审校报告等都一目了然。在Error Annotation中,还记录了错误密度、错误权重以及错误类别等数据,对于翻译轨迹的把握较为精细。由于涉及细节较多,故此处并非完全展示,仅概括大体功能。
图3
【关键词】机器翻译;译后编辑;计算机辅助翻译
【作者简介】秦国强,对外经济贸易大学。
引言
近年来,有关机器翻译的新闻在社会上引起了人们的广泛关注。以“机器翻译”为关键词在中国知网(CNKI)进行检索,可检索到5000多条结果。翻译软件层出不穷,以有道翻译、谷歌翻译等为首的主流翻译工具在人们的日常生活中发挥着越来越重要的作用。尽管如此,机器翻译的质量仍存在不少问题,英国著名语言学家John Hutchins(2003)曾指出:“机器翻译译文质量至今并没有取得实质性进展,50多年前未解决的很多问题如今依然存在。”这种背景下,新型的译后编辑应运而生,逐渐成为一种流行的翻译模式。那么译后编辑到底是什么?译后编辑的操作平台有哪些?不同的译后编辑环境之间有何差异?基于这些研究问题,本文将从实际案例出发,着重讨论三种不同译后编辑环境特点、作用,并对译后编辑的优化提出一些建议。
一、译后编辑概念解读
国外有关译后编辑的研究较早,在中国起步相对较晚。SDL所发布的译后编辑白皮书中,引用了其机器翻译项目首席科学家Daniel Marcu 对译后编辑的定义,即“译后编辑是指语言专家对机器翻译输出的译文进行编辑以生成人工质量翻译的流程”(SDL,2013)。ISO 17100于2013年发布的报告中,认为译后编辑是“检查和修正机器翻译的输出”。根据译后编辑的目的和程度,译后编辑还被分为“完全译后编辑”和“非完全译后编辑”(ISO,2015)。
关于译后编辑的概念,崔启亮(2014)综合了Allen(2003)等学者的观点,并基于翻译市场不断发展的现状,将译后编辑分为“狭义的译后编辑”和“广义的译后编辑”。该定义充分考虑到了翻译环境的变化以及翻译技术工具在翻译中的作用,不再单纯地将机器翻译译文作为编辑的对象,而是将机器翻译、翻译记忆库与人工翻译等相结合进行考虑。本文中所述的译后编辑环境既涉及广义的概念,也涉及狭义的概念,在论述中会有所区分。目前,译后编辑工具的整体使用比例已经达到了71%,对机器翻译及译后编辑的业务的需求也排到了第4位(中国翻译协会,2018)。随着OCR、机器翻译、语音识别及计算机辅助翻译软件的兴起,纯人工参与的翻译行为将越来越少,取而代之的是不断成熟的翻译自动化流程。
二、三类不同译后编辑环境的特点分析
一般来讲,译后编辑的环境主要有三种:1.文字处理软件;2.计算机辅助翻译工具;3.专业译后编辑工具。其中,常见的文字处理软件包括微软公司的Word,利用修订模式可对译文进行人工修改。计算机辅助翻译工具内部一般都嵌入了译后编辑平台,操作流程更加具有连续性,如Trados、memoQ等。而专业的译后编辑软件更加个性化、专业化,符合特定人士的需求,功能也更加强大,如翻译自动化用户协会(TAUS)发布的动态质量框架(DQF)。接下来本文将逐一对三种译后编辑环境进行分析。
1.文字处理软件中的译后编辑——以微软Word为例。Word是当下使用最广泛的办公软件,在文字处理方面具有很丰富的功能。而对译员来讲,Word中有很多与翻译辅助相关的功能,比如利用Word制作双语对其文档、使用Word宏功能进行快捷操作、通过查找替换进行翻译的校对等。而Word中的修订模式对译后编辑具有很大的帮助,能基本满足大多数人对翻译审校的需求。
(1)Word中译后编辑前的材料准备。在Word中获取需要編辑的译文有两种方法。第一种是借助免费的机器翻译工具如谷歌翻译、有道翻译等,通过复制粘贴的将译文转移到Word中;另一种是借助Word中的翻译插件(如有道翻译)直接进行译文生成。两种方式各有优缺点,采用译文转移方式进行译后编辑,需要不断重复复制粘贴,无法批量处理待翻译材料,但这种方法完全免费。而采用Word内嵌机器翻译引擎,可批量对源语进行处理,实现一键翻译,并且可直接将译文另存为docx文档,优化了翻译流程,但该方式需要译者支付一定的费用。
(2)Word译后编辑的流程。获取机器翻译译文后,译文修改之前,译者需要为译后编辑创造一个较为便捷的编辑环境。由于Word文档功能有限,无法自动生成双语对照的文字,不做处理的情况下译者编辑时效率较低。此时可对原文译文做编辑前的格式设置,将双语部分制作成段落数相等的两部分,采用文本转化成表格功能,可时文章分成左右对照的两部分,大大方便了译者对译文的修改方式。大致流程如下(如图1):
1)处理双语材料,调整段落使其完美对照;
2)全文选中,将文本转化成两列的表格;
3)开启修订模式,进行译文修改,确定最终译文;
4)将表格转化成文本,保留最终结果。
该方式对于一般性的译文修改效率较高,Word中的批注功能也可以很好地起到备注作用,对于译文疑难点、争议点都可以进行备注,方便后续译文审校。从上文探讨的定义上看,该译后编辑属于狭义上的译后编辑。
(3)Word译后编辑环境优劣分析。从整个操作流程来看,Word环境中的译后编辑使用起来较为简单,对低要求、专业性不强的小型翻译项目是一个不错的选择。另外,软件简单易用,获取方法便捷。作为一款文字处理软件,它对于文字的处理较为强大,但也正由于软件自身的局限性,并非所有的材料都适合进行译后编辑。例如,包含众多图片的docx不适合此方法,除docx格式以外的其他文档如xml、ppt、pdf等也不宜采用Word修订功能。此外,对于高质量、高要求的大型翻译项目,由于字数较多,包含术语复杂,用Word处理显然是远远不够的。 2.计算机辅助翻译工具中的译后编辑——以memoQ为例。计算机辅助翻译工具(Computer-aided Translation,简称CAT)是指专为提高翻译效率、优化翻译流程而设计的专门的翻译辅助软件,包括翻译记忆系统、术语管理工具、对齐工具和项目管理工具等(徐彬等,2007)。计算机辅助翻译工具重在“辅助”,并不完全非完全依靠计算机本身产出译文,这与机器翻译具有本质的差别。由于具有强大且完整的翻译体系,CAT软件能够进一步帮助人们实现更加多样化、复杂性的译后编辑环境。
(1)memoQ中译后编辑前的材料准备。首先需创建翻译项目。在利用memoQ进行文档导入时,有许多专业术语,导入了术语库,还可建立翻译记忆库。由于memoQ可进行预翻译功能,且翻译结果是由多个来源决定的。可以使用记忆库资源,若记忆库不匹配或者匹配度较低,则可选择自动调用机器翻译,其中机器翻译可根据译者需求进行接入。如图2所示,该页面即为原语通过记忆库和机器翻译双重处理后所生产的待编辑译文。因为翻译整合了翻译记忆等功能,在集成翻译环境下经过人工操作输出最终译文,这种译后编辑可以称为广义上的译后编辑:
(2)memoQ译后编辑的流程。译者所要修改的内容来自机器翻译内容和模糊记忆的匹配,这虽然在某种程度上降低了译员的认知努力,但同样需要译者根据不同匹配度对译文做出不同程度的修改。与单一的Word翻译平台不同,CAT软件大多内置质量保证工具。因此,在进行人工校对时,可初步由机器检测出有哪些明显错误需要修改。由于大型项目翻译文档复杂多样,且有很多格式上的要求,因此一些错误仅凭肉眼无法识别,需要借助质量保证工具进行预修正。质量保证工具可检查格式缺失、术语不一致、漏译、数字错误等质量问题,这对译员进行快速定位错误具有重要作用。memoQ中的跟踪修改功能设计也比较强大,可以很直观地向译者展示整个修订过程,并且还可及时更新翻译记忆库,具有提升翻译效率的作用。
(3)memoQ译后编辑环境优劣分析。与Word相比,memoQ在接入机器翻译基础上,还调用了翻译记忆库,机器翻译与记忆库的整合不仅降低了成本,也整体提升了译文的质量。同时,对于较为复杂格式的文本,memoQ也可以最大化地保留,降低了后期大量的排版时间。从技术层面上看,memoQ在译后编辑中已经取得了很大的进步,但是在术语等层面还有提升的空间,比如如何保证在预翻译过程中术语的一致性,如何实现机器翻译(译后编辑)与翻译记忆的有机融合,充分发挥两者的作用,构建一个集成化的友好翻译平台(冯全功、崔启亮,2016)?翻译记忆匹配值过高或者过低都无法充分发挥机器翻译或者翻译记忆的优势,这也是将来技术开发人员需要考虑的一个方向。
3.专业译后编辑工具——以TAUS DQF为例。除了较基础的Word审校工具以及功能全面的CAT译后编辑平台,还有一些定制版的译后编辑工具。目前翻译市场上定制化的译后编辑工具多种多样,也更加满足翻译公司内部的实际需求。本文将以TAUS发布的DQF工具为例,简要探讨其在译后编辑方面所起的主要作用。
(1)TAUS DQF中译后编辑前的材料准备。DQF是一款嵌入SDL Trados中的插件,译者可通过该软件计算编辑距离,即指两个字串之间,由一个转成另一个所需的最少编辑操作次数,用来比较译后编辑和机器翻译初始译文之间的变化。这种方法可用来计算译后编辑人员为使译文达到某种质量要求所付出的努力,也可用来评估机器翻译的质量,而在此我们主要分析其在译文审校编辑过程中的作用。根据DQF的使用指引,在Trados中需先创建好项目,随后将项目添加到DQF中,进而创建项目文件包。同理,可按照类似memoQ的译前处理方式对材料进行预翻译,得到初步译文。
(2)TAUS DQF譯后编辑的流程。DQF Dashboard可以捕捉译者在Trados中的翻译信息,显示在某个时间段里译者翻译的句段数、字数、所耗时长等,该面板为在线网页,如图3所示。同样,在审校时需要创建审校包,在主界面就会显示该项目的有关信息。在这种环境下,之前的翻译数据清楚可见,其中译文更正数量、注释数量、审校设置、翻译和审校报告等都一目了然。在Error Annotation中,还记录了错误密度、错误权重以及错误类别等数据,对于翻译轨迹的把握较为精细。由于涉及细节较多,故此处并非完全展示,仅概括大体功能。
图3