论文部分内容阅读
以单个词为中心的词典编纂传统和语料库研究所揭示的语言短语趋向之间存在矛盾。一方面,纸质和电子词典通常将单个词作为词目组织的主要索引单位(词目词)。另一方面,语料库研究发现,短语经常具有重要的语用和语篇功能,一些短语单位本身就是意义承载者。和单个词相比,词典对短语的处理往往不够凸显、不够充分。与此同时,有越来越多的研究开始研发学术英语短语列表,目的是为了帮助非本族语者和写作新手进行学术写作。而一些在线学术英语词典也开始对词束(lexical bundles)这类短语进行表征。不过应当指出,这些短语列表主要是用于教学目的,无法直接用作词典词目词,而在线词典对于词束的描写和表征方面还有较大提升的空间。鉴于此,本研究试图用实证方法创建一个面向词典编纂的词束列表,这些词束在通用学术英语写作中高频出现,并被认为适合作为词目词。我们先是利用Sketch Engine来自动提取一个词束列表,然后依靠可复制的人工筛查标准和统计手段去掉不合适的词束,最后得到了80个四词目标词束。我们接着从词束覆盖度、宏观和微观结构等方面定量分析了目标词束在高阶英语学习词典中的表征情况。此外,为进一步改进词典对于词束的处理,我们比较了两种扩展词束描写的方法(频率法和搭配法),发现通过搭配法来扩展四词词束更为有效。基于这些发现,我们最后提出了一个改进学术英语词束词典处理的新模型。本研究主要有以下发现:一、方法层面上,证明了创建一个面向在线英语学习词典编纂(非本族语者和写作新手为目标用户)的学术英语词束列表是可行的;二、定量分析表明,目标词束的表征因词典而异,表征程度普遍不够充分;三、发现并实证检验了一种扩展词束描写的新方法(搭配法),目前对该方法的研究还较少。研究意义包括:一、聚焦词典对语料库短语的表征,强烈呼吁在线词典对我们提炼出的学术英语词束按词目词处理,以更好地满足非本族语者和写作新手的学术短语需求;二、有助于加强词束研究和电子(数字)词典研究之间的协同;三、展示了扩展词束描写的可能,对于“终极词典”(Sinclair et al.2004)的构建有一定启示意义。研究局限包括:一、只关注四词词束,没有考虑其它可能在学术写作中高频出现的更大或更小的词束;二、目前牛津学术英语语料库只能在Sketch Engine平台上检索,因而词束提取会受限于Sketch Engine“N-grams功能”的参数设定,这一定程度上会影响研究结果;三、没有识别学习者易误用的词束;四、没有调查不同微观结构处理方式对目标词束的查阅、记忆和产出的影响。希望将来的研究能够解决这些问题。