论文部分内容阅读
自从十六世纪蒸汽机问世以来,机器替代人工就一直是一个不可逆转的趋势,而以计算机为代表的信息技术的发展则更加强化了这一点。机器翻译,或称计算机翻译,是一种使用计算机来实现不同自然语言间相互转换的技术,其研究建立在语言学、数学和计算技术这三门学科的基础之上,既是一门新学科,也是一门结合了语言学和计算机科学等学科的交叉学科。人类产生使用机器进行翻译的想法由来己久,其历史可追溯至十七世纪时,哲学家如莱布尼兹与笛卡尔提出代码字的概念,在字和语言间建立起了联系。但“机器翻译”则是近100年才出现的新概念。时至今日,虽已历经70多年的研究探索,但机器翻译产出的译文质量仍无法达到能令人满意的程度。鉴于这样的现实,在20世纪70年代有人提出了现今被称为“翻译记忆(translation memory)"的概念,即充分运用数据库功能,将已翻译好的文本内容加以储存。日后遇到相似或相同的翻译文句,电脑会自动比对数据库中已有的译文并为翻译人员提供建议,让其白行决定是否接受、加以修订或放弃使用。较为著名的电脑辅助翻译工具包括OmegaT、Trados、Transit Wordfast、Logopor、Microsoft LocStudio、IBMTM/Win、Google Translator Toolkit等。这些工具通常需要与翻译记忆库(TM)一同使用,翻译记忆库由若干翻译记忆单元组成,每个单元均包含源语言的一个句段(segment)以及其所对应的译文。这些句段可以是文字区块、章节、一个或是数个句子、或是词语。随着互联网的普及,各类网上资源日益丰富,其中也不乏各类双语平行文本,特别是中英双语文本就更是数量巨大。本文试图通过计算机程序自动获取这些网络资源,并将之转化为标准的翻译记忆库文件(TMX),配合相应的翻译辅助工具使用。以求更好地发挥这些网络资源的作用,将简单重复的劳动交由电脑完成,使译者的精力集中于核心译文的产出,为翻译工作提供更大的便利。对于程序代码自动生成的TMX文件,本文还进行了进一步的测试,包括统计评估和问卷调查。测试结果证明了由代码自动生成计算机辅助翻译记忆库文件的可行性和有效性。