论文部分内容阅读
摘 要 语料库在词典编纂中具有极大的优势。本文借助在线语料库,从新词新意收录、近义词区分、副词释义、词语搭配等方面研究《牛津实用英汉双解词典》的可改进之处。
关键词 语料库 词典编纂 搭配
1、引言
近年来,随着计算机技术的迅猛发展,与之相关的语料库技术也在不断发展,而语料库最直接的用途就是词典编纂(lexicography) (李赛红 2002:4)。语料库(corpus)是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库(杨惠中 2002∶33)。语料库中客观、真实、生动的语料为广大词典编纂者提供了强大的选择空间;同时,通过对语料库的统计,还可以发现词语出现的频率、搭配、语境、文体等等方面的特点,为词典编纂提供了极其丰富的题材。本文试图运用两个在线字典BYU-BNC和“英汉双语平行语料库”(麓巍)来分析《牛津实用英汉双解词典》的可改进之处。
2、语料研究
2.1、语料库可以指导词典编纂中的搭配问题
搭配是语料库词典学中的一个非常重要的方面。搭配检索可以说明哪些副词或介词通常与哪些动词一起使用,以及它们的用法是如何影响意义的。搭配通常被描述为约定俗成的、听起来自然的词语组合(Moon 2000:2-5)。语料库中可以测定两个词在一起的几率。以下为对return搜索:
在BYU-BNC中检索到return共出现16340次,而return back共7次,部分摘录如下:
而《牛津实用英汉双解词典》对动词return的定义包括:
1、come or go back to a place 回,返回;
2、(return to)go back to (a particular state or activity) 复归(某状态);恢复(某活动);
3、 give, send, or put back 退回;送回;归还;放回;
4、feel, say, or do (the same feeling, action, etc.) in response回报,回应(感情、动作等):She returned his kiss 她回吻了他。
从语料库的检索结果我们可以看出,return和back是可以连用的,但不是很普遍。而使用Google 搜索return back, 也可以发现一些句子如:I should get my tax return back today? Could You Return My Money Back? | British Council - English Online等等。既然有活生生的语料存在,人们(特别是学习英语的人)在进行搜索或阅读的时候便会产生疑问:既然return指的是come or go back to a place,那么为什么后面又加了个back呢?这是不是多余的?这部词典是不是没有收入这种特殊搭配呢?实际上,许多时下的新闻标题中都出现了return back一词,这说明该短语已经为大多数人所接受,然而许多词典,包括柯林斯精选英语词典、韦氏英语惯用法词典等都没有收录这个词语,而《牛津实用英汉双解词典》这部相对比较新(1997年出版)的词典,里面也没有收录这个义项。这说明,词典编纂具有滞后性,而借助语料库,便可以最大可能的弥补词典在搭配方面的不足。
2.2、用以解决常被忽视的副词词义的标注问题
长期以来,副词在词典中很容易被忽视,因为它总是被设置成形容词的内词条,通常情
况下,人们总是认为副词的意思很容易就可以通过形容词的词义推断出来,而事实上,有许多副词的词语并不那么容易推断出来。比如在《牛津实用英汉双解词典》中,flatly就设置成了flat的内词条派生词,然而形容词flat有很多的意思,如:平坦的、扁平的、水平的、无精打采的、瘪了的、明确的、偏低的。根据“英汉双语平行语料库”的搜索结果,我们可以发现flatly这个词的常用意思:
90521 He flatly denied it.
他断然否定这事。
90522 He flatly refused to join us.
他断然拒绝跟我们在一起。
109012 I flatly refuse to come.
我断然拒绝来。
由上面的语料可以发现,flatly最常指的是“断然地”。因此,人们在查阅《牛津实用英汉双解词典》时,就无法准确把握住flatly这个词的具体含义。
而significantly也同样是做为一个派生词设置的,没有任何解释,只显示了词性。Significant在这部词典里指的是“重要的、重大的、影响深远的、别有含义的”。而根据BYU-BNC搜索结果,significantly被使用过4172,属于使用频率比较高的一个词,而“英汉双语平行语料库”对significantly的搜索结果显示,这个词最常用的意思不是“重要地”,而是“极大地、显著地”。通过语料库的词频统计可以发现,这个词的使用频率比较高,且意思与其形容词差异比较大,应该单独立目,给出释义。
2.3、语料库可以指导词典编纂中近义词的问题
近义词在词典中属于一个棘手的问题,处理不好就很容易出现重复、循环释义,这也是
学生学习时的一个难点。《牛津实用英汉双解词典》第1036页对relation 和relationship的释义就存在一定的问题:
Relation
1. the way in which two or more people or things are related关系,关联;
2.(relations)the way in which two or more people or groups feel about and behave towards each other(人际或团体之间的)关系,往来
3. a relative 亲戚;家属
4.(relations)formal 【正式】sexual intercourse 性关系
Relationship
1. the way in which two or more people or things are related关系,关联;
2. the way in which two or more people or groups feel about and behave towards each other(人际或团体之间的)关系
3. a loving and sexual association between two people (两人间的) 恋爱关系,性关系
通过对比我们可以发现,这两个词条的前两项是一模一样,而relationship也仅仅比
relation少了一个“亲戚”的义项。这就给英语学习者带来了很大的困惑,这两个词到底有什么区别呢?可否互换呢?这时,借助语料库进行分析就显得十分必要了。通过BYU-BNC语料库检索,得出relation2793个例子,relationship12682个句子,并且能够得到以下例子:
通过分析综合语料库中的原始语料,我们可以根据词频出现发现:relationship用法最广,出现次数最多,包括了relation的许多含义。 relation和 relationship可都用以表示亲属关系;而 relationship可以指强烈的感情联系。若不侧重个人关系或友谊时,两者都可以使用。因此,通过分析语料,我们可以更好地把握各近义词的区别,最好在词典中标示出来,以方便读者的查阅。
2.4、借助语料库编纂词典可以及时更新词条
随着社会的不断发展,语言也日渐丰富起来,许多新词不断地涌现。Internet(因特网)风靡全球,表示计算机网络的“cyber”正成为一个活跃的前缀,而cyberspace(网络空间)、surf(漫游)等也变得家喻户晓。Mad Cow Disease(疯牛病)、clone(克隆)也渐渐为人们所熟悉。通过BYU-BNC(这个语料库的范围仅仅是从1980s到1993年)搜索可以发现,cyberspace的频率高达11次,cyber也拥有14次的频率,surf则有263次,Mad Cow Disease共出现26次,clone出现357次。而《牛津实用英汉双解词典》中却没有录入这些词。
另外,有些生活中熟悉的旧词具有了新的意思,如: bug原指虫子,现在的意思是硬件或者软件中的漏洞(缺点)。host:原指主人,现在的意思是电脑主机。mouse原指老鼠,现在的意思是鼠标。memory:原指记忆,现在的意思是内存。这在“英汉双语平行语料库”中可以找到例子:
82738 excite for web servers bug.
针对网络服务器错误的令人振奋的信息。
677 " It measures every single mouse click.
可以记录下鼠标的每一次点击。
由此可见,语料库对新词新意或旧词新意具有很好的补充借鉴作用,可以很好地指导词典编纂进行更新。
3、结论
通过以上的分析可以发现,语料库在进行词典编纂方面具有巨大的优越性:无论是在发掘新词新义上,还是近义词区分上,无论是分析副词成分上,还是在词语搭配研究上,都有着巨大的潜力。因此,词典编纂时应多汲取语料库中的精华,做到更完善。
参考文献
[1] BYU-BNC: BRITISH NATIONAL CORPUS (100 MILLION WORDS, 1980s-1993) http://corpus.byu.edu/bnc/x.asp
[2] Moon, 《英语中的固定表达语和习语——基于语料库的方法》[J],2000. 2-5
[3 ]李赛红. 解构英国国家语料库[J ] . 外语教学与研究,2002 .4
[4]麓巍. 英汉双语平行语料库检索页面. http://www.luweixmu.com/ec-corpus/query.asp
[5]牛津实用英汉双解词典. 牛津大学出版社编著. 北京:外语教学与研究出版社,2007
[6]杨惠中. 语料库语言学导论[M] . 上海:上海外语教育出版社,2002. 33
关键词 语料库 词典编纂 搭配
1、引言
近年来,随着计算机技术的迅猛发展,与之相关的语料库技术也在不断发展,而语料库最直接的用途就是词典编纂(lexicography) (李赛红 2002:4)。语料库(corpus)是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库(杨惠中 2002∶33)。语料库中客观、真实、生动的语料为广大词典编纂者提供了强大的选择空间;同时,通过对语料库的统计,还可以发现词语出现的频率、搭配、语境、文体等等方面的特点,为词典编纂提供了极其丰富的题材。本文试图运用两个在线字典BYU-BNC和“英汉双语平行语料库”(麓巍)来分析《牛津实用英汉双解词典》的可改进之处。
2、语料研究
2.1、语料库可以指导词典编纂中的搭配问题
搭配是语料库词典学中的一个非常重要的方面。搭配检索可以说明哪些副词或介词通常与哪些动词一起使用,以及它们的用法是如何影响意义的。搭配通常被描述为约定俗成的、听起来自然的词语组合(Moon 2000:2-5)。语料库中可以测定两个词在一起的几率。以下为对return搜索:
在BYU-BNC中检索到return共出现16340次,而return back共7次,部分摘录如下:
而《牛津实用英汉双解词典》对动词return的定义包括:
1、come or go back to a place 回,返回;
2、(return to)go back to (a particular state or activity) 复归(某状态);恢复(某活动);
3、 give, send, or put back 退回;送回;归还;放回;
4、feel, say, or do (the same feeling, action, etc.) in response回报,回应(感情、动作等):She returned his kiss 她回吻了他。
从语料库的检索结果我们可以看出,return和back是可以连用的,但不是很普遍。而使用Google 搜索return back, 也可以发现一些句子如:I should get my tax return back today? Could You Return My Money Back? | British Council - English Online等等。既然有活生生的语料存在,人们(特别是学习英语的人)在进行搜索或阅读的时候便会产生疑问:既然return指的是come or go back to a place,那么为什么后面又加了个back呢?这是不是多余的?这部词典是不是没有收入这种特殊搭配呢?实际上,许多时下的新闻标题中都出现了return back一词,这说明该短语已经为大多数人所接受,然而许多词典,包括柯林斯精选英语词典、韦氏英语惯用法词典等都没有收录这个词语,而《牛津实用英汉双解词典》这部相对比较新(1997年出版)的词典,里面也没有收录这个义项。这说明,词典编纂具有滞后性,而借助语料库,便可以最大可能的弥补词典在搭配方面的不足。
2.2、用以解决常被忽视的副词词义的标注问题
长期以来,副词在词典中很容易被忽视,因为它总是被设置成形容词的内词条,通常情
况下,人们总是认为副词的意思很容易就可以通过形容词的词义推断出来,而事实上,有许多副词的词语并不那么容易推断出来。比如在《牛津实用英汉双解词典》中,flatly就设置成了flat的内词条派生词,然而形容词flat有很多的意思,如:平坦的、扁平的、水平的、无精打采的、瘪了的、明确的、偏低的。根据“英汉双语平行语料库”的搜索结果,我们可以发现flatly这个词的常用意思:
90521 He flatly denied it.
他断然否定这事。
90522 He flatly refused to join us.
他断然拒绝跟我们在一起。
109012 I flatly refuse to come.
我断然拒绝来。
由上面的语料可以发现,flatly最常指的是“断然地”。因此,人们在查阅《牛津实用英汉双解词典》时,就无法准确把握住flatly这个词的具体含义。
而significantly也同样是做为一个派生词设置的,没有任何解释,只显示了词性。Significant在这部词典里指的是“重要的、重大的、影响深远的、别有含义的”。而根据BYU-BNC搜索结果,significantly被使用过4172,属于使用频率比较高的一个词,而“英汉双语平行语料库”对significantly的搜索结果显示,这个词最常用的意思不是“重要地”,而是“极大地、显著地”。通过语料库的词频统计可以发现,这个词的使用频率比较高,且意思与其形容词差异比较大,应该单独立目,给出释义。
2.3、语料库可以指导词典编纂中近义词的问题
近义词在词典中属于一个棘手的问题,处理不好就很容易出现重复、循环释义,这也是
学生学习时的一个难点。《牛津实用英汉双解词典》第1036页对relation 和relationship的释义就存在一定的问题:
Relation
1. the way in which two or more people or things are related关系,关联;
2.(relations)the way in which two or more people or groups feel about and behave towards each other(人际或团体之间的)关系,往来
3. a relative 亲戚;家属
4.(relations)formal 【正式】sexual intercourse 性关系
Relationship
1. the way in which two or more people or things are related关系,关联;
2. the way in which two or more people or groups feel about and behave towards each other(人际或团体之间的)关系
3. a loving and sexual association between two people (两人间的) 恋爱关系,性关系
通过对比我们可以发现,这两个词条的前两项是一模一样,而relationship也仅仅比
relation少了一个“亲戚”的义项。这就给英语学习者带来了很大的困惑,这两个词到底有什么区别呢?可否互换呢?这时,借助语料库进行分析就显得十分必要了。通过BYU-BNC语料库检索,得出relation2793个例子,relationship12682个句子,并且能够得到以下例子:
通过分析综合语料库中的原始语料,我们可以根据词频出现发现:relationship用法最广,出现次数最多,包括了relation的许多含义。 relation和 relationship可都用以表示亲属关系;而 relationship可以指强烈的感情联系。若不侧重个人关系或友谊时,两者都可以使用。因此,通过分析语料,我们可以更好地把握各近义词的区别,最好在词典中标示出来,以方便读者的查阅。
2.4、借助语料库编纂词典可以及时更新词条
随着社会的不断发展,语言也日渐丰富起来,许多新词不断地涌现。Internet(因特网)风靡全球,表示计算机网络的“cyber”正成为一个活跃的前缀,而cyberspace(网络空间)、surf(漫游)等也变得家喻户晓。Mad Cow Disease(疯牛病)、clone(克隆)也渐渐为人们所熟悉。通过BYU-BNC(这个语料库的范围仅仅是从1980s到1993年)搜索可以发现,cyberspace的频率高达11次,cyber也拥有14次的频率,surf则有263次,Mad Cow Disease共出现26次,clone出现357次。而《牛津实用英汉双解词典》中却没有录入这些词。
另外,有些生活中熟悉的旧词具有了新的意思,如: bug原指虫子,现在的意思是硬件或者软件中的漏洞(缺点)。host:原指主人,现在的意思是电脑主机。mouse原指老鼠,现在的意思是鼠标。memory:原指记忆,现在的意思是内存。这在“英汉双语平行语料库”中可以找到例子:
82738 excite for web servers bug.
针对网络服务器错误的令人振奋的信息。
677 " It measures every single mouse click.
可以记录下鼠标的每一次点击。
由此可见,语料库对新词新意或旧词新意具有很好的补充借鉴作用,可以很好地指导词典编纂进行更新。
3、结论
通过以上的分析可以发现,语料库在进行词典编纂方面具有巨大的优越性:无论是在发掘新词新义上,还是近义词区分上,无论是分析副词成分上,还是在词语搭配研究上,都有着巨大的潜力。因此,词典编纂时应多汲取语料库中的精华,做到更完善。
参考文献
[1] BYU-BNC: BRITISH NATIONAL CORPUS (100 MILLION WORDS, 1980s-1993) http://corpus.byu.edu/bnc/x.asp
[2] Moon, 《英语中的固定表达语和习语——基于语料库的方法》[J],2000. 2-5
[3 ]李赛红. 解构英国国家语料库[J ] . 外语教学与研究,2002 .4
[4]麓巍. 英汉双语平行语料库检索页面. http://www.luweixmu.com/ec-corpus/query.asp
[5]牛津实用英汉双解词典. 牛津大学出版社编著. 北京:外语教学与研究出版社,2007
[6]杨惠中. 语料库语言学导论[M] . 上海:上海外语教育出版社,2002. 33