论文部分内容阅读
【摘要】作为世界上词汇量最大的语言之一,英语中存在着大量的近义词,传统的词汇辨析一般依赖于权威的英语大词典,如牛津,朗文,柯林斯等,但学习者并不能通过词典来寻找到他们所需要的某些词之间的细微差别。而语料库的出现,则使研究者们在辨析近义词时有了大量真实发生的语料为支撑,也为他们提供了一套极为科学有效的分析工具。本文则将借助COCA语料库辨析具有“限制”一义的三个词:confine,restrict和restrain,通过检索这组近义词在COCA语料库中的使用情况,从词频分布、显著搭配词、在语域中的搭配特征等方面来分析他们的异同,为英语学习者提供借鉴,进而提高英语学习者利用真实语料对近义词的辨析能力。
【关键词】COCA语料库;近义词;搭配;辨析
【作者简介】卢明远(2001.01-),男,汉族,安徽人,巢湖学院外国语学院,本科在读,研究方向:英语语言学。
一、引言
随着英语的不断发展,大量的借词、隐喻与转喻、升格与降格等原因使得英语中出现了大量的近义词。据统计,英语语言中同义词 、 近义词的数量约占总词汇量的 60 %以上 (贺晓东,2003,它们通过词形、词义、结构或用法等方方面面的相同或相近构成了庞大的英语词汇体系,而如何正确地辨析这些近义词之间的细微差距,从而更加确切地使用这些词,使用成了英语外语学习者(EFL)甚至是本族语学习者面临的一大难题。突破了这一重要环节,也就突破了提高英语阅读写作以及口语交际等技能的关键。
值得庆幸的是,语料库语言学的兴起与发展为词汇研究开辟了新的视角,同时也为近义词辨析提供了新的方法和依据。机读语料库因其语料真实丰富、覆盖不同文体语域、反映语言全貌、易于检索分析等根本优势,在很大程度上弥补了过去英語词汇辨析因为语言材料不够充分而多依赖主观自省的不足,使词语辨析开始从传统的直觉经验方法转向基于科学实验、定量统计和定性分析的方法。
美国当代英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库。该语料库由美国杨百翰大学的Mark Davies教授主持创立并于2008年正式上线。此语料库包含超过10亿单词的文本(1990-2019年每年2500多万单词),来自八个类型:口语、小说、流行杂志、报纸、学术文本、电视和电影字幕(2020年3月更新)、博客和其他网页。本文以美国当代语料库COCA为基础,研究confine,restrict和restrain在词频、在语域中的使用、搭配和语义韵等方面的异同,帮助英语学习者提高近义词的辨析能力,以便更加正确地使用近义词。
二、COCA语料库的检索结果与分析
1.词频分布。COCA中的精确数据表明,confine、restrict和restrain在发生频率上有着显而易见的差异。根据表1可知,restrict是三个词中最经常使用的单词,使用频率高达6178次,远高于restrain的2624次,几乎是confine使用频率4.5倍。而对比restrain和confine,前者的使用频率也接近于后者的两倍。
2.不同语域中词频分布差异。语域(Register)是语言使用的场合或领域的总称。其概念最早由Raid于1956年提出,后由英国语言学家韩礼德(M. A. K. Halliday)等人将其完善,而他将语域定义为,语言变体可以按照使用的情况划分为语域。语域是人们在实际的语言活动中,出于交际的需要,或因其所从事的职业和兴趣相异,抑或因其话语发生的情景、说话的对象、地点和话题的不同而产生的一种言语变体,体现语言中的不同语体风格、用语格调等。同义词由于其内在意义的差异,在不同的语域中往往会呈现出不同的分布特征,所以统计它们不同语域中的频率差异,有助于将它们区分开来。
从COCA检索所得的每百万词的显示频率(表2)来看,我们可以得出以下结论:confine、restrain和restrict三词在不同语域中的使用偏向也有一定区别。首先,confine一词比较倾向于书面语,从表2来看,它在学术写作中的出现频率最高,而在电视和电影、小说和口语中出现的频率极低,但因其出现的总频率不及后两个词,仅凭表2来判断得出的结果参考意义不大,具体我们会在后文详细论述。然后是restrict一词,除了小说和电影电视,它的使用频率都要高于另外两个词,另外,虽然不及confine在口语中的使用频率之低,但它也主要用于书面语。再者是restrain,从表2可以很明显地看到,它并没有如以上所述两个单词那样倾向于某几个语域,而是在八个语域相对均匀地分布。最后,由于三个词出现的总频率相差甚远,restrict不管是在口语还是正式写作中的使用,也远高于confine和restrain。
由此可见,传统的借助词典的近义词辨析方法仅仅依靠基本释义、语法结构和一些简单的例句是远远不够的。而借助语料库的科学实践,让学习者对近义词的辩证理解上升到了理性的层次,实现了哲学上所讲的二次飞跃,也为他们今后在不同场合正确使用这些词起到了很好的指导作用。
3.同义词的搭配行为特征。在此部分,笔者首先在COCA在线语料库的collocates功能下分别以confine、restrict和restrain为节点词,不限制搭配词类,在跨距为±3的范围内提取搭配词,利用 MI值来测量搭配词与节点词之间的显著搭配程度,笔者此处设置 MI≥3。此后人工剔除不符合要求的部分数据,进而概括分析检索出的显著搭配词(选自频率排名前20的显著搭配词)。
(1)confine在COCA中的搭配词。从表3显示的数据可以分析得出,节点词confine在COCA中的显著搭配词大致可以分为以下不同语义组: 反身代词:themselves、myself、itself、ourselves、himself、yourself等,情态动词:must、shall等,表示空间范围或范围限制的词:narrow、within、quarters等,人的行为活动类:discussion、attention、comments、activities、search、remarks、efforts、analysis等。这里尤其要注意的是,confine oneself to do something的使用频率极高,而且confine与反身代词的显著搭配占据了榜上的前六。另外,我们还可以看出,confine主要是“限制”人的 “评论”“讨论”“分析”等一些语言活动还有“限制”一些活动的范围,且多为抽象的词。
因此,confine与反身代词、范围限制的词以及人的主观活动类单词的搭配是最频繁也是最地道的,这给了我们学习者很大的借鉴,以避免将confine一词的使用范围扩大或者产生错误的受母语影响的搭配。
(2)restrain在COCA中的搭配词。首先,表4的数据显示,restrain和confine共享部分搭配词项。如反身代词myself、himself、themselves、ourselves、yourself等,但restrain还多了反身代词herself以及人称代词him。其次,restrain还和表示企图、尝试、努力的词trying、tried、try、attempt、efforts等構成显著搭配。还可分为政治经济类单词:government、spending、growth、costs,形容词、副词able(能够)、unable(不能够)、physically(身体上的)等。
由此可以看出,尽管restrain和confine共享不少词项,但两者的差异还是很大的,restrain一词很明显更加适用于描述政治经济类的单词,与其搭配较为显著。且与人的主观努力类动词和名词的搭配也很地道,这两点便构成了它和confine的最大不同。
(3)restrict在COCA中的搭配词。从表5可以得出,restrict一词的显著搭配词可以分为:社会运动或热点类词:rights、laws、freedom、abortion、speech、movement等;人的生存和发展类词:access、use、ability、efforts等;还有表示程度或深度的further、severely等。
在这次检索中,restrain的搭配词又体现出与前面两词截然不同的特征,它在一些社会热点话题上,如“自由”“权利”“堕胎”“法律”等问题上,搭配的频率更高,其次是人的生存与发展类:“机会”“能力”“努力”等,和restrain的两大搭配词类也没有太多的交集。
至此,我们可以大胆地得出结论,学习者们在想表达“限制”人的“讨论”“评论”等活动以及范围时,可以直接选择高搭配频率的confine,而在表示“限制”政府的“支出”“花费”,经济的增长等,可以使用restrain,而涉及社会热点话题“自由”“权利”和“堕胎”等以及人的生存发展类单词,则可以毫不犹豫地转向restrict一词。这样,不仅更符合英语本族语者的取词心理,也符合他们在实际语言交际和写作中的搭配特征。
三、结语及启示
本文借助COCA语料库,使用了基于语料库同义词辨析的一般方法(张继东,刘萍,2005),借助大量真实的语料证明了confine、restrain和restrict三词的不可替换性,也细致分析了他们的异同和用法区别。研究还证明了语料库辅助学习在词汇语义和用法学习中的可靠性,通过本文,以期今后教师们能够在课堂上实施语料库教学,也提倡学生能独立操作和使用语料库工具。
参考文献:
[1]Effendi Is AmaliaR, LalitaS A. “Are Synonyms Always Synonymous? A Corpus-assisted Approach to Announce, Declare, and State.”[J]. ASIAN TEFL Journal of Language Teaching and Applied Linguistics, 2020,(1):1-20.
[2]张继东,刘萍.基于语料库同义词辨析的一般方法[J].解放军外国语学院学报,2005(6):53-56 100.
[3]潘璠,冯跃进.基于语料库的同义词差异性特征调查[J].山东外语教学,2000(4):8-12.
[4]桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[5]孟贞.基于语料库的英语同义短语搭配行为研究——以depend on、rely on和count on为例[J].现代交际,2020(21):89-91.
【关键词】COCA语料库;近义词;搭配;辨析
【作者简介】卢明远(2001.01-),男,汉族,安徽人,巢湖学院外国语学院,本科在读,研究方向:英语语言学。
一、引言
随着英语的不断发展,大量的借词、隐喻与转喻、升格与降格等原因使得英语中出现了大量的近义词。据统计,英语语言中同义词 、 近义词的数量约占总词汇量的 60 %以上 (贺晓东,2003,它们通过词形、词义、结构或用法等方方面面的相同或相近构成了庞大的英语词汇体系,而如何正确地辨析这些近义词之间的细微差距,从而更加确切地使用这些词,使用成了英语外语学习者(EFL)甚至是本族语学习者面临的一大难题。突破了这一重要环节,也就突破了提高英语阅读写作以及口语交际等技能的关键。
值得庆幸的是,语料库语言学的兴起与发展为词汇研究开辟了新的视角,同时也为近义词辨析提供了新的方法和依据。机读语料库因其语料真实丰富、覆盖不同文体语域、反映语言全貌、易于检索分析等根本优势,在很大程度上弥补了过去英語词汇辨析因为语言材料不够充分而多依赖主观自省的不足,使词语辨析开始从传统的直觉经验方法转向基于科学实验、定量统计和定性分析的方法。
美国当代英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库。该语料库由美国杨百翰大学的Mark Davies教授主持创立并于2008年正式上线。此语料库包含超过10亿单词的文本(1990-2019年每年2500多万单词),来自八个类型:口语、小说、流行杂志、报纸、学术文本、电视和电影字幕(2020年3月更新)、博客和其他网页。本文以美国当代语料库COCA为基础,研究confine,restrict和restrain在词频、在语域中的使用、搭配和语义韵等方面的异同,帮助英语学习者提高近义词的辨析能力,以便更加正确地使用近义词。
二、COCA语料库的检索结果与分析
1.词频分布。COCA中的精确数据表明,confine、restrict和restrain在发生频率上有着显而易见的差异。根据表1可知,restrict是三个词中最经常使用的单词,使用频率高达6178次,远高于restrain的2624次,几乎是confine使用频率4.5倍。而对比restrain和confine,前者的使用频率也接近于后者的两倍。
2.不同语域中词频分布差异。语域(Register)是语言使用的场合或领域的总称。其概念最早由Raid于1956年提出,后由英国语言学家韩礼德(M. A. K. Halliday)等人将其完善,而他将语域定义为,语言变体可以按照使用的情况划分为语域。语域是人们在实际的语言活动中,出于交际的需要,或因其所从事的职业和兴趣相异,抑或因其话语发生的情景、说话的对象、地点和话题的不同而产生的一种言语变体,体现语言中的不同语体风格、用语格调等。同义词由于其内在意义的差异,在不同的语域中往往会呈现出不同的分布特征,所以统计它们不同语域中的频率差异,有助于将它们区分开来。
从COCA检索所得的每百万词的显示频率(表2)来看,我们可以得出以下结论:confine、restrain和restrict三词在不同语域中的使用偏向也有一定区别。首先,confine一词比较倾向于书面语,从表2来看,它在学术写作中的出现频率最高,而在电视和电影、小说和口语中出现的频率极低,但因其出现的总频率不及后两个词,仅凭表2来判断得出的结果参考意义不大,具体我们会在后文详细论述。然后是restrict一词,除了小说和电影电视,它的使用频率都要高于另外两个词,另外,虽然不及confine在口语中的使用频率之低,但它也主要用于书面语。再者是restrain,从表2可以很明显地看到,它并没有如以上所述两个单词那样倾向于某几个语域,而是在八个语域相对均匀地分布。最后,由于三个词出现的总频率相差甚远,restrict不管是在口语还是正式写作中的使用,也远高于confine和restrain。
由此可见,传统的借助词典的近义词辨析方法仅仅依靠基本释义、语法结构和一些简单的例句是远远不够的。而借助语料库的科学实践,让学习者对近义词的辩证理解上升到了理性的层次,实现了哲学上所讲的二次飞跃,也为他们今后在不同场合正确使用这些词起到了很好的指导作用。
3.同义词的搭配行为特征。在此部分,笔者首先在COCA在线语料库的collocates功能下分别以confine、restrict和restrain为节点词,不限制搭配词类,在跨距为±3的范围内提取搭配词,利用 MI值来测量搭配词与节点词之间的显著搭配程度,笔者此处设置 MI≥3。此后人工剔除不符合要求的部分数据,进而概括分析检索出的显著搭配词(选自频率排名前20的显著搭配词)。
(1)confine在COCA中的搭配词。从表3显示的数据可以分析得出,节点词confine在COCA中的显著搭配词大致可以分为以下不同语义组: 反身代词:themselves、myself、itself、ourselves、himself、yourself等,情态动词:must、shall等,表示空间范围或范围限制的词:narrow、within、quarters等,人的行为活动类:discussion、attention、comments、activities、search、remarks、efforts、analysis等。这里尤其要注意的是,confine oneself to do something的使用频率极高,而且confine与反身代词的显著搭配占据了榜上的前六。另外,我们还可以看出,confine主要是“限制”人的 “评论”“讨论”“分析”等一些语言活动还有“限制”一些活动的范围,且多为抽象的词。
因此,confine与反身代词、范围限制的词以及人的主观活动类单词的搭配是最频繁也是最地道的,这给了我们学习者很大的借鉴,以避免将confine一词的使用范围扩大或者产生错误的受母语影响的搭配。
(2)restrain在COCA中的搭配词。首先,表4的数据显示,restrain和confine共享部分搭配词项。如反身代词myself、himself、themselves、ourselves、yourself等,但restrain还多了反身代词herself以及人称代词him。其次,restrain还和表示企图、尝试、努力的词trying、tried、try、attempt、efforts等構成显著搭配。还可分为政治经济类单词:government、spending、growth、costs,形容词、副词able(能够)、unable(不能够)、physically(身体上的)等。
由此可以看出,尽管restrain和confine共享不少词项,但两者的差异还是很大的,restrain一词很明显更加适用于描述政治经济类的单词,与其搭配较为显著。且与人的主观努力类动词和名词的搭配也很地道,这两点便构成了它和confine的最大不同。
(3)restrict在COCA中的搭配词。从表5可以得出,restrict一词的显著搭配词可以分为:社会运动或热点类词:rights、laws、freedom、abortion、speech、movement等;人的生存和发展类词:access、use、ability、efforts等;还有表示程度或深度的further、severely等。
在这次检索中,restrain的搭配词又体现出与前面两词截然不同的特征,它在一些社会热点话题上,如“自由”“权利”“堕胎”“法律”等问题上,搭配的频率更高,其次是人的生存与发展类:“机会”“能力”“努力”等,和restrain的两大搭配词类也没有太多的交集。
至此,我们可以大胆地得出结论,学习者们在想表达“限制”人的“讨论”“评论”等活动以及范围时,可以直接选择高搭配频率的confine,而在表示“限制”政府的“支出”“花费”,经济的增长等,可以使用restrain,而涉及社会热点话题“自由”“权利”和“堕胎”等以及人的生存发展类单词,则可以毫不犹豫地转向restrict一词。这样,不仅更符合英语本族语者的取词心理,也符合他们在实际语言交际和写作中的搭配特征。
三、结语及启示
本文借助COCA语料库,使用了基于语料库同义词辨析的一般方法(张继东,刘萍,2005),借助大量真实的语料证明了confine、restrain和restrict三词的不可替换性,也细致分析了他们的异同和用法区别。研究还证明了语料库辅助学习在词汇语义和用法学习中的可靠性,通过本文,以期今后教师们能够在课堂上实施语料库教学,也提倡学生能独立操作和使用语料库工具。
参考文献:
[1]Effendi Is AmaliaR, LalitaS A. “Are Synonyms Always Synonymous? A Corpus-assisted Approach to Announce, Declare, and State.”[J]. ASIAN TEFL Journal of Language Teaching and Applied Linguistics, 2020,(1):1-20.
[2]张继东,刘萍.基于语料库同义词辨析的一般方法[J].解放军外国语学院学报,2005(6):53-56 100.
[3]潘璠,冯跃进.基于语料库的同义词差异性特征调查[J].山东外语教学,2000(4):8-12.
[4]桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[5]孟贞.基于语料库的英语同义短语搭配行为研究——以depend on、rely on和count on为例[J].现代交际,2020(21):89-91.