论文部分内容阅读
对平行语料库的研究是近些年来语料库语言学横向发展的新趋势。对于机器翻译、电子词典的升级、英汉汉英对比语言学以及翻译教学等,让人们更加意识到,建设开发平行语料库的价值。对于平行语料库而言,其中最基础的单位是对应单位。对应单位是最新提出的,这为平行语料库提供了一个全新的概念。而“非对应”是相对于“对应单位”来说的。基于平行语料库研究双语文本中的“非对应”部分,也是基于语言事实下,鼓励我们发现翻译中的非对应现象,从而促进翻译教学或者机器翻译等。
“对应单位”(CU)被定义为“源语言和目标语言文本中任何可以识别的相互对应的语块”(李文中,2006)。而“非对应”(NC)则是目的语中没有对应译文的部分,或者是译文中存在而在源语言中没有对应的部分。当然这些都是宏观的概念。在我们建设平行语料库时,我们需要做的是选出对应单位,而剩下的语料就属于是“非对应”。在具体研究中,每一个“对应单位”,都是由一个“源语言对应单位”(CUS)和“目标语对应单位(CUT)”。那么在选择完对应单位后,剩下的非对应是单独的部分,我们可以将其认为是(NCS)或者是(NCT)。与“对应单位”(CU)不同,“非对应”(NC)是单个出现的,并非成对。
本文主要研究问题如下:
(1)“非对应”(NC)都有哪些特征?
(2)“非对应”(NC)的语法分类有哪些?
(3)产生非对应的原因有哪些?
研究目标为:
(1)基于本校与上海交通大学最新合作建立的平行语料库,在本文中称为JDPARALLEL CORPUS平行语料库,对非对应的分析。
(2)将“非对应”这一理念初步运用到翻译研究、平行语料库建设等相关领域中去。
本文简单介绍了交大平行语料库的建立和“对应单位”的提取流程。本研究中的使用的语料库就是我校与交通大学共同合作完成的平行语料库。该语料库就是基于李文中教授所提出的“对应单位”,进而人工提取出每对对应单位。在相关软件辅助下,我们可以查询到库里的对应的和非对应的部分。通过分析平行语料库中的非对应,我们来确定非对应的形式。基于该数据库,我们对源语言中的非对应和目标语中的非对应进行了考察,主要有:
1、源语言是英语(SLE)和目标语是汉语(TLC)时,SLE对零和TLC对零时的情况。
2、源语言是汉语(SLC)和目标语是英语(TLE)时,SLC对零和TLE对零时的情况。
“非对应”这一概念是相对于对应单位的,是面向应用的。从平行语料库中提取的“非对应”可以用作翻译教学数据库,或者对机器翻译提供某些依据。这对翻译教学、机器翻译、语料库语言学以及平行语料库研究都会有些帮助。非对应和对应单位数据库对人工翻译会有些帮助和改进,如果平行语料库数据库足够大,且其拥有的对应单位、非对应也足够多的话,将会为以上领域做出更多的贡献,让机器翻译等在更广的领域可以进行。该数据库还可以用于同义词、歧义词学习,翻译以及双语语言学习等其它相关领域。“非对应”的实际意义与使用,还有待更多研究,某些理论和技术也有待完善。