论文部分内容阅读
基于语料库的语言对比研究和语言本体研究自上世纪九十年代就在世界范围内蓬勃发展起来了。相比之下,基于双语平行语料库的翻译研究,尤其是涉及汉语的翻译研究却相对滞后。目前国内尚无已经发布的、可直接用于研究的汉英平行翻译语料库,而在建的大型语料库尚处于研发阶段,尚未建立成熟的结构框架和足够大的数据存储量。因此本文拟结合语言学、语法学、翻译学和计算机系统工程技术提出大型汉英/英汉平行翻译语料库的设计,然后通过自建小型翻译语料库验证所提出的设想,并基于该语料库探讨翻译语料库在翻译研究、翻译实践、翻译教学和自动翻译领域的应用。汉英/英汉平行翻译语料库的建设过程包括总体设计、数据库框架设计、语料收集、语料导入、双语句子对齐、双语句子分词、语料校对等步骤。在总体设计上,大型汉英/英汉平行翻译语料库包含四个子库和若干专科语料库;在数据库建设时,采用群组分布式操作模式和以句子为基本存储单位的关系型数据库;在语料导入时,语料将统一以txt文本形式进入数据库;在对齐和分词时,采用计算机程序运作与人工校对相结合的方法。为了发挥翻译语料库巨大的实证作用,必须设计与翻译语料库相匹配的语料库检索平台。本文借鉴语言学语料库的检索功能,设计了关键词检索、模糊检索、搭配检索、句型检索、对译词词频统计、多作品联合检索、多译者联合检索、检索结果自动排序等8项适用于翻译研究的检索项目。翻译语料库及其检索平台在翻译研究、翻译实践、翻译教学和自动翻译等领域都具有较大的实用价值。在翻译研究领域,基于语料库能实现宏观的翻译普遍性、汉英对应结构翻译、译者译作风格等方面的研究,这些研究需要巨大数据量的支持,在翻译语料库出现之前是不可能的;在翻译实践方面,语料库的参考作用贯穿翻译行为的始终;在翻译教学上,翻译语料库是一本活的教科书,能随时根据教学需要提供大量素材;在自动翻译领域,目前翻译语料库能用于翻译词典的编撰,将来翻译语料库将成为机器翻译的支撑平台。