小型语料库检索与大学英语教学

来源 :卓越管理 | 被引量 : 0次 | 上传用户:jj__yy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  最近一些年来,电子语料库检索已经成为了计算机语言学家、语料库语言学家、词典编纂者等的主要研究领域。但他们大都使用大型语料库,规模达到数百万词。而小型语料库检索在大学英语教学环境中是一种相对较新的应用尝试,近年来它也吸引了不少英语研究者和教师。该论文讨论了小型语料库检索在英语教学的三个不同领域的应用:1. 教学大纲的设计和评价;2. 课堂教学;3. 测试设计。尤其是作为英语教学法的发展,课堂语料库检索方法因其基本理论、潜在价值、当前应用和影响而受到学者们广泛的讨论。这篇论文对到目前为止小型语料库检索研究的成果和前人的一些重要评价进行了总结,并为将来的研究指出了一些方向。
  
  这篇文章从EFL/ESL教学的前景到小型语料库检索 (SCC) 的作用和应用做了回顾,主要集中于大学英语课堂教学中的SCC。并以当前文献资料为基础浅析了大纲设计与评价和测试设计中SCC应用。
  
  什么是“语料库检索(concordancing)”?
  英语中的“语料库检索”— concordancing 这一词源于单词 concordance (词汇索引)。在柯林斯词典里concordance一词的解释是:书籍中按字母(表)顺序排列的单词表,根据这个单词表可以找到每个单词在书中的位置和使用频率。Tribble指出concordance是为了帮助解释圣经中的和其他具有社会价值的文本而设计出的一种参考方式。Tribble和Jones还指出concordance早在中世纪就已经出现,用来注解一些著名作家的作品,比如莎士比亚的著作。绝大部分索引工作都是手工完成的,所以可以想象这是一个极其艰辛的工作。
  计算机出现以后,词汇检索生成的“速度和准确性(Tribble and Jones)”是手工检索无法比拟的。Sinclair说到:三十年前,……处理规模为几百万词的文本几乎是不可能的。二十年乃至十年以前,这一想法有些可行但仍然有些疯狂。如今,这样的事已经很平常。
  Tribble 也说过,“过去手工检索所花费的努力是巨大的,……大的超出了大多数个人的承受能力。”有时候检索数百单词量的文本都很耗时耗力,更不用说百万级的文本。如Foulds所注意到的,“通常处理几百单词量的文本所需要的时间可能多到与它的价值不符,显得完全不划算”。
  因此,计算机检索这一想法在于使以前人们希望做但因为人力和时间的限制而无法做的工作变成了可能。而且,随着计算机检索的推广,越来越多的人已经意识到它的潜力,并接着开始进行各种与检索相关的语言学研究和ESL/EFL教学应用。然而,计算机索引这个术语已经广泛出现在与ESL/EFL教学相关的文献中,但却没有一个清晰的定义。它被广泛认为是一种文本的处理方法。Tribble和Jones把计算机检索说成是“给出特定单词在文本中出现的位置并列出每一出处的上下文”,然而Levy将索引定义为“一个单词在文本中所有出现的集合,每一处都引用了该词的上下文,并带有参考文献和词频统计”.
  随着电脑索引的发展,手工索引自然就消失了,如今索引一词无论什么时候被使用都已经被认为是基于计算机技术的而不是手工操作的。Higgins在他评论性的文章中谈到MSDOS索引软件时给出了这样的定义:一个单词的索引是一组引文或行引用, 可使这个单词在文本语料库中每个出现的地方都被检索到。
  电脑在检索中的作用是将一个单词或单词串在一个或一组文本(语料库)中所有出现时的上下文都显示出来。实现这一目的的软件被称为检索软件。有时候有些电脑软件被称为索引生成程序或索引软件(Tribble and Jones)。COMPAID 就是这样一个例子(Fang). 与计算机操作系统相关的应用程序比如MS-DOS环境下的FIND.EXE(Hinggins),或者在一些复杂的字处理软件如WordPerfect或Microsoft WORD下运行的自制宏也能实现这一目的。(Tribble & Jones)
  一个被检索词(关键词)的上下文在电脑上的显示方式因所使用的软件和操作系统的差异呈现出不同。句子索引显示出被检索词所在的句子。而段落索引则显示段落(Johns)。KWIC(key-word-in-context关键词)索引到目前为止在研究人员和教师中使用的最为广泛,它将被检索的词放在一行中间,左右两端分别取相等的长度然后截断以填满整行。由计算机生成的索引既可以显示在屏幕上也可以打印成副本,或者存档以便将来使用。
  
  大型语料库检索
  检索软件在文本分析中的使用多年来都局限在计算机语言学和语料库语言学的领域内,两者在语言研究中都是相对较新的领域,计算机的出现和普及才使它们成为可能。这些分析主要是在大型计算机上进行的,而且是基于大型语料库,规模都在几千万词以上。对词典编纂者们来说,文本分析的好处主要在于它能够对语言的工作机制提供客观的描述。
  在主要的研究项目中最著名的就包括COBUILD项目,由伯明翰大学承担。很多词典和参考书都是在此基础上完成并推广到市场(Sinclair)。其它的例子包括布朗大学的Brown Corpus、兰开斯特大学的LOB Corpus,以及上海交通大学的科技英语语料库-JDEST。
  
  小型语料库检索(SCC)
  除了大型语料库检索,可在微机上进行分析的小型语料库越来越受到人们的关注。人们对它兴趣的不断增长与计算机辅助语言学习(CALL)的发展是一致的,它们都是计算机时代催生的产物,如今计算机在ESL/EFL教师和研究者中已经相当普及。人们对SCC的关注开始于80年代中期,主要得益于Higgins和Johns在1984年以及Johns在1986年和1988年的研究成果,这在SCC中带来了一场运动,这场运动的结果就是基于计算机的文本分析走到了教师、课程设计者、教料开发人员还有学习者的身边。SCC无论是作为文本分析工具还是教学活动都在世界各地的微机上不断的接受着检验。
  研究者们认为在一些大型语料库无法发挥作用的场合如专业学术语言研究、课堂教学等小型语料库可以发挥替代作用。Tribble和Jones建议5万词规模的小型语料库非常适合课堂教学使用。他们在教学实验中所用到的语料库由口笔语语料组成,共4万5千词。不过这5万词限定的依据尚不清楚,只是通过对一些研究者所使用的小型语料库的规模进行研究后粗略得出的一个结论。
  
  SCC用于教学大纲的设计和评估
  早在1988年Sinclair和Renouf就提出了要基于“常用词汇的一般用法”来设计一个通用的英语教学大纲。而“常用词汇的一般用法”就是由在COBUILD语料库中用计算机生成的词频列表来确定(Sinclair & Renouf)。Willis, J.D.和 Willis, J.R.使用同一语料库的数据进一步完善了这一想法并开发了一本通用英语教程,同时Willis, J.D.还设计完成了他的词汇大纲(Willis)。
  说到SCC在教学大纲和课程设计中的应用,Flowerdew处于该研究领域的领先地位。Flowerdew使用基于索引的单词计数器来了解单词的按相对重要性从而建立词条之间顺序,并提供教学大纲选择和分级的标准。他还使用了用生物学讲座记录建立的专业语料库来和COBUILD语料库进行词频的对比,观察它们之间一些相似之处和主要差别。有人认为这些观察结果能为ESP课程的设计建立基础。Flowerdew 建议SCC可以用来寻找有价值的教学点,揭示相关单词的句法模式,找出可能存在于教学大纲里的功能区和意念区(Flowerdew)
  Ma在他的基于检索分析的直邮销售信函类型研究中发现了在由50封信函组成的小型语料库中对于销售中不同的程序步骤会有特定的语气和情态与之对应。祈使句在开场和消费号召阶段中被大量使用,但是在开场中从未和敬辞“请”一同使用。Can、will和may 在产品描述阶段中大量出现,而must、ought to和should 很少出现。在消费吸引阶段基本上都是使用带For或To的主位化目的状语从句。有人认为这些研究结果应该对商务写作课程的教学大纲和教学材料的设计具有很大的参考价值,在课程中学生们需要练习这一类销售信函的写作。
  除了大纲设计SCC还可以用来评估现有的课程和教材(Flowerdew)。在Flowerdew的语料库中像then这样的连接词出现在主语和动词之间,而不是像很多出版教材里教的那样出现在句首。单词call基本上完全承担了定义功能,而一些商业出版教材却把注意力倾向于单词define。人们同样发现一些出版材料忽略了很多被动结构中的插入状语。另外在Ma的语料库中销售信函的附言部分被看成是写作规范而不是特例,而大多数出版材料可能由于设计不周都忽略了这部分(Ma)。
  
  SCC用于课堂教学(课堂检索)
  很多研究者和应用语言学家(特别是Stevens, Johns, and Tribble和Jones)都大力支持把SCC用于外语教学(EFL)的想法,通常称之为课堂检索(CC)。
  在EFL课堂里检索更多的被看成是一种教或学的方法而不是文本分析的途径。Johns把基于索引的教学法称为数据驱动学习(DDL)。就像名字所揭示的,这种方法的特点在于语言数据在语言学习中承担主要角色。Johns认为索引能够提供“吸收”,即输入中对语言学习者实际有用的部分,它在典型的教材式语言和交际语言之间获得一种合理的平衡,前者具有高度的组织性,分级严格,是理想化的语言;而后者虽可能难于理解但更加丰富,更加真实可信,更加深刻透彻(Johns)。
  就可靠性而言,Stevens指出课题检索能提供“真实性和相关性”。然而由教师开发的词汇练习常常带有无意识的人造痕迹。基于索引的材料“保证了内容将总是真实的”并且“当所使用的语料库文本适合于为其设置练习的语言学习者时具有相关性”。
  Johns进一步把真实性细分成三个方面:内容真实、用途真实和活动真实。他相信在课题检索中教师是展示真实的文本内容而不仅仅是搜罗文本。用途的真实在于“学生可以检索在课程和研究中需用到的文本”,而“活动的真实在于围绕文本展开的学习活动可转移到现实的情景中。”
  Levy认为索引“精确地呈现了语言的真相”因为它是以语言“真实的用法”为基础。因此索引的使用者会参考单词用法的“来源和原例”,而不是通过其它媒介如词典来窥探单词的用法。Johns说:“数据驱动学习(课题检索)方法的区别在于它尽可能的消除中介语的影响,使学习者直接获取语言数据…”。
  Johns也认为课题检索能将语言溶入上下文中研究并除去语言中的神秘色彩。通过观察使用中的自然语言,小型语料库检索能“消除由空谈语言学带来的的歪曲和不真实”,而且它还能消除语言教师仅凭直觉来回答学习者的提问。
  在说到可靠性和探索性的概念时,Tribble和Jones指出检索的真正价值在于其可见性。检索软件可以让使用者以前所未有的方式目睹文本的特征。Tribble把课堂检索的使用描述成“使不可见的成为可见”,而且他还评论说课堂检索是一个“传统语言教学中的新方法”。Rundell和Stock进一步发展了检索的可见性理论,他们说:“也许语料库检索数据最明显的一个特征就是它所展示信息的必然性。”虽然Rundell和Stock是从词典编纂者的角度来讲的,但是他们的话肯定适用于那些把语料库检索软件看成语言学习工具的学习者,因为这些学习者也扮演了和语言学研究者相同的角色。
  在学习者的探索过程中计算机和检索软件被看成是一位特殊的信息提供者,使学习者能够获得语言数据。Johns认为这一方法突破了传统,是数据驱动型的方法,是一种归纳学习,与传统方法有着区别,因为真实的数据取代了教师在教学中的基础地位。人们认为课堂检索法通过让学习者了解语言行为的真实现状来培养他们的能力。Levy还强烈推荐在词汇搭配教学中使用课题检索。他相信索引给出的一系列范例能够帮助学习者很好的理解单词的用法。Tribble和Jones更是将语料库检索的用途做了以下的总结:
  A. 检索结果可用于:
  1. 根据上下文推测关键词的含义
  2. 研究单词的语法特征
  3. 研究同形同音异义词和同义词
  4. 小组学习活动
  5. 单词填空练习
  6. 单词配对练习
  7. 基于学习者自身写作的修改练习
  B. 互动功能:
  1. 语法学习
  2. 词汇扩展
  3. 专门用途英语教学
  
  SCC用于测试设计
  迄今为止大多数教师和研究者都将小型语料库检索(SCC)用于教学相关的领域。也许是第一个将SCC用于英语教学测试环境。Butler把SCC用于试题编制,如他认为SCC能够改进完形填空题,因为由索引生成的词汇填空题都摘自语料库中的多个文本,从而能消除由单一文本所带来的内容偏差。Butler所做的就是使用检索软件检索语料库,然后生成一所选词为中心的句子索引。完形填空测试考查的是一系列在内容上相互关联的词,而句子检索输出的结果用字处理软件很容易编制成完形填空题,尽管它不能提供一个较完整的语篇内容。
  大多数研究者和教师都对小型语料库检索的应用充满热情,相信它能给外语教学提供真实可靠的语料。小型语料库检索已经在外语教学领域掀起了一股热潮而且还将继续持续下去,越来越多的教师开始尝试在他们的课堂中应用这一方法。然而实际上这一应用在研究文献中反映的并不多,尤其是国内文献,且在实际应用中对学习者反馈的系统研究还不够。大多数工作都还只是停留在思考推论阶段,没有得出最终的评价和结论。而且小型语料库的建设也存在各种问题,比如只注重书面语而容易忽略口语从而导致学习者语言能力的失衡。到目前为止课题检索的应用还只限于水平较高的学习者中,而其主要用在语法和词汇教学中。其推广价值还在探索之中,有待研究者们共同的努力。(作者单位 九江学院)
其他文献
青岛齐能化工有限公司(下称“齐能化工”)的新任董事长刘迪因涉嫌非法集资数十亿被山东省聊城市公安局东昌府分局拘捕。以同样罪名被批捕的还有齐能化工另外8名管理层人员,另有10余名工作人员被刑事拘留。  继吴英、曾成杰之后,刘迪成为又一个因非法集资而身陷囹圄的企业家。从创立之初到旗下拥有二十余家企业,到持股两家上市公司,昔日风光无限如今已千疮百孔。就在齐能化工因涉嫌非法集资被查之前,其资本市场上的两次大
经外周静脉置入中心静脉导管(peripherally inserted central catheter, PICC)作为一种更为有效、安全、高性价比的治疗方式,自20世纪70年代应用于临床实践以来,产品不断更新
随着各界对现代教育的重视,我国的高等教育也逐步进入了一个全面改革的快速发展时期。各高校在大力推行教学改革的过程中,将本科生导师制作为一项重点的教育管理制度,在教学改革
西南航空每年都会收到超过10万份简历,我们只会聘用其中1%~2%的申请者.有权威人士通过统计分析,得出这样的结论:一个人想进入西南航空,比被哈佛大学录取更难.
第六站参观兵马俑后,三个小朋友就对陕西的历史产生了浓厚的兴趣.他们通过手机查询到,华清宫景区是国家首批5A级景区,骊山温泉因开发利用早且备受历代帝王的青睐,享有“天下
期刊
通过新建杭州至黄山铁路HHZQ-5标段DK103+848.78~DK104+285.275路基填筑现场路桥过渡段的施工,探讨了路桥过渡段的施工技术及质量控制要点,并阐述了过渡段填筑工艺和质量检测
目的:探讨膝关节人工置换术后康复锻炼效果观察.方法:选取2018年1月-2018年12月我院收治的膝关节人工置换术患者120例,随机分为两组,对照组采用常规护理,研究组在对照组的护
关键词: 高中化学 核心素养 渗透策略  核心素养主要是指一个人终身发展所具备的品格和能力.高中化学课堂教学中,渗透核心素养教育,有利于学生快速成长,提高学生的综合能力和综合素质.化学作为高中阶段的重要学科,在高考中有着十分重要的地位.对于高中阶段的学生来讲,加强化学学科知识的学习,提高学生自身的素质,有利于学生的个性发展.因此,高中化学教师在课堂教学中,应当重视核心素养的渗透教育,实现课堂教学的
摘要:本文从我国少儿舞蹈教育发展中存在的课外培训考级热,基础教育舞蹈冷的现状出发,探讨出现这种现象的原因以及对策,旨在探索走出一条中学素质教育舞蹈课的新路径,做到“透过舞蹈的教育”。让舞蹈服务全体学生,和谐人品,醇化情感,陶冶情操,培养全面发展的人才。   关键词:少儿舞蹈;素质教育舞蹈课;自我价值  中图分类号:G632.0 文献标识码:A 文章编号:1992-7711(2019)02-0
无风险收益率、风险溢价和企业盈利是影响市场的三个核心因素。一季度,无风险收益率和风险溢价双降,虽然企业盈利实际情况很差,但极差的经济数据反而衍生出了经济在二季度或者三季度触底反弹的期望。从板块表现来看,对风险溢价敏感的高贝塔板块反弹最为猛烈,对于无风险收益率敏感的低估值“类债券”板块和对于企业盈利增长敏感的成长股板块涨幅落后,显示出风险溢价下降是推动一季度市场反弹最为重要的力量。  二季度,企业盈