基于共时语料库的高职EGP写作量化研究

来源 :现代职业教育 | 被引量 : 0次 | 上传用户:CBN_cntjlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘           要]  将近些年语料库语言学中针对口笔语的研究方法迁移至高职EGP写作的评估中,以云南能源职业技术学院2018级全体学生作文组建的语料库为研究对象,通过分析对比相关数据,从整体上对当前云南能源职业技术学院乃至同类型的高职院校学生的英语写作能力有进一步了解,填补高职院校在EGP写作语料库研究方面的短板,并为下一步的EGP教学改革提供一定的量化依据。
  [关    键   词]  写作;语料库;量化研究
  [中图分类号]  G712                 [文献标志码]  A                    [文章编号]  2096-0603(2020)41-0064-02
   一、引言
   (一)语料库语言学研究现状
   20世纪60年代初,语料库语言学便已问世。国外学者Meyer认为“语料库语言学主要是一种语言研究方法,而不是语言学中的一个独立的研究范式”[1]。而在国内,何中清和彭宣维认为“它以大量真实的语言数据为研究对象,进行多层次和全方位研究,揭示语言现象隐含的普遍规律,它的出现对语言研究产生了巨大影响”[2]。在经历半个多世纪的发展后,当前的语料库语言学已成为一个计算机科学与语言学交叉发展的热点领域。
   (二)选题意义
   对学生写作质量的评估是一个极为重要的研究热点,但绝大多数高职院校教师仍在使用人工逐一审阅和定性描述的方法对学生作文进行评估,很难面向同行或学生给出令人信服、标准规范化的质量评估结论。所以,将语料库理论和研究方法引入高职院校英语写作教学中,在微观方面可为教师的教學工作提供更好的“诊断”手段,为学生自主学习提供更好的指导。在宏观层面,基于量化数据的评估结论也可为学校乃至教育主管部门提供更好的英语教学改革依据,让教学改革做到“对症下药”“有的放矢”。
   二、研究设计
   (一)语料库建设
   本项目以云南能源职业技术学院2018级全体学生的客观写作材料为研究对象,以语料库为研究方法,得出相关的标志性参数,并参考中国学习者英语语料库(CLEC)、布朗语料库(Brown Corpus)同类型数据参数,以此得出对比结论。
   首先,项目组通过机辅写作软件采集云南能源职业技术学院2018级全体学生的作文共2670篇,40多万个英文单词。因为本项目的目的是对学生的写作质量进行评估,在语料收集完毕后,我们对语料进行了处理,把作文中相关性较小的内容,如标题以及人名等删除。其次,我们利用Free CLAWS web tagger在线词性标注软件,依据UCREL CLAWS5 Tagset的标准对语料内容进行标注,把语料库的词性(POS)标注出来,最终将云南能源职业技术学院2018级学生作文库命名为YVIET2018。
   (二)数据分析
   完成语料库的标注与处理之后,我们利用Wordsmith3.0对观察语料库YVIET2018与参照语料库CLEC、Brown Corpus的数据进行提取。
   1.标准化类形符比(STTR)
   形符(token)是指语料库中的一切单词,包括反复运用过的单词,即语料库中所有单词的总数。类符(type)是指语料库中一切不反复的单词的总数。类形符比(TTR, type-token ratio),是指语料中呈现的类符与形符的比率,它标志着语料库中词汇的多样性或者词汇的丰沛度(lexical density)。但语料库体量的大小对TTR值有一定的影响,所以我们采用标准化类符形符比(STTR, standardized type-token ratio),即大小为1000词的连续多个语料库的平均类形符比,以此对比不相同的多个语料库的类形符比差异,参数更加可信。由此,我们得出了3个语料库的STTR值。YVIET2018的数据是38.37,CLEC是32.8,而Brown是39.04,说明在词汇丰沛度方面,云南能源职业技术学院2018级学生的整体情况优于国内英语学习者的平均水平,在写作中更加善于使用多样化的词汇表达,更加接近源自英语母语国家的语料库BROWN的水平。
   2.词汇密度(lexical density)
   词汇密度这一概念最早由Ure提出。他认为词汇密度的计算公式为实词数除以词汇总数所得百分比[3]。而Halliday认为语法词反映的是句子的流畅度和表达清晰度(explicitness)以及可预测性(predictability)[4]。而词汇词反映的是文本所含的信息量(information load)。
   所以,我们使用Wordsmith3.0对三个语料库的标注结果进行了检索和统计。因检索结果过于复杂庞大,这里不再详细列出。我们检索了名词(Noun)、动词(Verb)、形容词(Adjective)、副词(Adverbial)四大类词。YVIET2018语料库的实词密度为59.39%,其次是CLEC语料库,为53.28,而最小的是BROWN语料库,为48.93%。综合来看,YVIET2018语料库实词比例明显过多,说明云南能源职业技术学院2018级学生在写作技巧上仍有明显的短板,虽然文本承载的信息量丰富,但这样的文本会给读者在理解文本信息时带来困难,不善于使用虚词,文本的清晰度与流畅度稍差一些。因为BROWN语料库所收集的语料均来自美国,故而在文本信息量和清晰度、流畅度平衡度方面是三者中最好的。    3.高频词(high frequency words)
   在语料库语言学的分析方法中,频率是一种非常重要的研究手段。Sinclair(1991:31)提出,语料库中高频词的分布较为稳定,因此频率排序的任何显著变化都有可能具有重要意义[5]。而Laviosa指出,高频词(“list head”or “high frequency words”)是一个词汇出现的次数与特定语料库所有形符的比例不少于0.01%[6]。在本研究中,我们通过Wordsmith3.0对三个语料库的词频进行了检索和统计。根据这一结果我们得出,高频词数量最多的语料库是YVIET2018,其累计占比为68.83%,是三个语料库中最多的,而BROWN语料库仅有高频词85项,占比38.81%,是三者中最少的,而CLEC语料库介于两者之间,这符合项目组的预期值。数据结果表明YVIET2018语料库词汇重复率是最高的,说明云南能源职业技术学院2018级的学生写作用词较为单调。BROWN语料库的词汇重复率是最低的,语料用词相对复杂,符合英语口笔语用词中避免重复而多用替换的原则。
   4.词长(word-length)
   对文本而言,文体正式程度往往与复杂词汇的数量成正比,即文体越正式,复杂词汇数量也就越多,反之亦然。为此,我们统计了三个语料库的词长。我们出乎意料地发现YVIET2018语料库的平均词长高于CLEC和BROWN,达到了4.80,BROWN語料库为4.48,CLEC语料库仅为4.07。但经我们仔细观察分析发现,就7个字母以上的单词而言,YVIET2018的词汇数量远远少于BROWN。由统计结果我们可以得出,云南能源职业技术学院2018级的学生在写作过程中对复杂词有偏好,但这样会使作文文体过于正式和严肃,并给读者理解信息带来一定困难甚至偏差。
   5.平均句长(mean sentence length)
   平均句长统计的是语料库中每一个句子中平均包含的词汇数量,这一指标能够在一定程度上反映句子的复杂度。通常来说,长句中包含的信息量更多,逻辑关系更复杂,对作者和读者的写作能力与理解能力要求都比较高。这里,我们统计出3个语料库的平均句长和句长标准差2个数据,YVIET2018的平均句长为17.88,比起CLEC的14.75,更加接近BROWN的19.47,说明云南能源职业技术学院2018级学生作文的句子复杂度更大,句子较为复杂。但YVIET2018的句长标准差为12.87高于CLEC的10.47,也说明云南能源职业技术学院2018级学生的作文水平个体差异是更加明显的,个体之间的水平差距比较大。
   三、结语
   通过本次项目,我们以语料库语言学为研究方法,使用wordsmith等工具,深入调查研究了云南能源职业技术学院2018级学生的写作情况,并得出了量化数据为支撑的对比结论,并将借此结论在下一步的大学英语教学中开展相关教学实验。这对我校乃至高职院校的大学英语教学都是一次十分有益的尝试。但受限于项目组能力等其他客观因素,未能对学生作文的写作语境、读者反馈等环节领域开展深入研究。在下一步的研究中,我们还将持续扩展云南能源职业技术学院学生作文语料库,开展历时性语料库研究。
   参考文献:
   [1]张新杰.国内语料库语言学研究:回顾与展望:基于核心期刊24年文献的统计分析[J].西安外国语大学学报,2017(6):36-41.
   [2]何中清,彭宣维.英语语料库研究综述:回顾、现状与展望[J].外语教学,2011(1):6-11.
   [3]李德超,王克非.汉英同传中词汇模式的语料库考察[J].现代外语,2012(4):409-415.
   [4]吴菲.国内外英语语料库的建设和发展评论[J].山东外语教学,2007(6):28-31.
   [5]王天剑.基于语料库的中国《政府工作报告》英语本词汇特征研究[J].当代外语研究,2010(6):39-43.
   [6]赵秋荣,王克非.英译汉翻译语言的阶段性特点:基于历时类比语料库的考察[J].中国翻译,2013(3):15-19.
  编辑 冯永霞
其他文献
[摘 要] 远程教育能较大程度避开生理缺陷对残疾人的制约,促进残疾人教育事业发展。为了解德阳残疾人远程学习现状,在3个不同单位对121名残疾人进行了调查,包括基本情况、学习的初始能力、动因、需求、兴趣、资源获取等方面。结果显示,残疾人基本具备远程学习的初始能力,学习需求主要集中在生活技能和其他技能,学习主要动因是提高自己。但残疾人群体的整体学历较低,对远程教育资源的获取途径局限于社区与残联
期刊
[摘 要] 部分高校在培育“双带头人”方面已经取得一定成绩,但仍存在部分问题。从教师思想、工作机制、保障体系以及激励机制四个方面展开分析,分别指出各自的不足及对应的改进路径。  [关 键 词] 高校;“双带头人”;培育路径  [中图分类号] G645 [文献标志码] A [文章编号] 2096-0602(2020)40-0098-02   党支部书记是各高校党
期刊
[摘 要] 工作室模式是现阶段应用型本科高校人才培养的优秀范式。首先分析当前应用型本科高校环艺专业教学情况,然后阐释工作室模式是解决高校人才培养问题的最佳途径,最后以景德镇学院环艺专业软件课程为例,探讨工作室模式下高校环艺专业人才培养方法和对策,以供参考。  [关 键 词] 工作室模式;应用型本科高校;环艺专业;人才培养  [中图分类号] G642 [文献标志码] A
期刊
[摘 要] 用实例证明调查实践是增强大学生生态道德教育实效性的有效途径,具体表现在大学生对人与自然之间的生态道德关系的认识已深入内心,对生态道德规范有更好的理解和掌握;生態敬畏感、生态荣辱感、生态责任感、生态正义感、生态亲和感明显增强;保护水环境和环境卫生的意识增强,在日常生活中能自觉养成节约用水和爱护环境卫生的良好的生态道德生活方式和行为方式;积极关注生态环境保护或者参加环保的其他社会活
期刊
[摘 要] 通过对高校大学生的调查问卷及走访得知,大学生手机依赖现象比较严重,据此基于大学生手机依赖发生机理,根据兰州工业学院在校大学生手机依赖现状的调查问卷为依据,对大学生手机依赖的干预路径进行探究。  [关 键 词] 大学生;手机依赖;发生机理;干预策略  [中图分类号] G645 [文献标志码] A [文章编号] 2096-0602(2020)40-011
期刊
[摘 要] 遗传咨询是以商谈和指导的方式为遗传病患者及其亲属或其他相关人员提供服务,内容主要涉及遗传病的发病原因、遗传方式、诊断、治疗与预防、复发风险等,并就婚配与生育等问题给出建议。遗传咨询在我国有近50年的历史,但由于遗传性疾病自身的特点和遗传病诊治水平的限制,我国的遗传咨询工作整体发展较慢,水平不高,地区发展水平存在较大的不平衡,且临床遗传学在部分医学院校和医院还不是独立的学科,很多
期刊
[摘 要] OBE理念以成果为导向,遵循反向设计原则,从需求开始,由需求决定学校人才培养目标。在校、院以及专业三级培养目标统整的基础上,确立毕业能力指标体系,并由此确立课程体系、教学组织及知识选择(课程与知识单元)的纵向连贯体系。以教师素质养成课程为例,基于OBE(成果导向教育)教学理念,从教学内容的构建、教学方法的改进、评价机制的完善等方面探讨了教师素质养成课程教学改革,突出能力培养,明
期刊
[摘 要] 慕课在职业技能培训中发挥着非常重要的作用,并且具有较好的培训效果。基于此,将以供应链管理课程为例,从理论知识、技能示范、课内研讨和展示、课程制作、课程内容维护、学习理念、培训目标七个方面论述慕课在终身职业技能培训中的应用,从而更好地发挥慕课在终身职业技能培训中的教学优势。  [关 键 词] 慕课;职业技能培训;供应链的管理;课程维护  [中图分类号] G712
期刊
[摘 要] 采用“有无对比”方法,分析深水航道建设从水深 7米整治到 12.5米所带来的直接经济效益。利用南通港可查船舶数据、货物数据等基础数据,把整个工程分为2个阶段,按照集装箱船、散货船分别测算深水航道整治所带来的直接经济效益。  [关 键 词] 深水航道;有无对比;直接经济效益  [中图分类号] G712 [文献标志码] A [文章编号] 20
期刊
[摘 要] 高职扩招的新时代背景下,心理健康教育工作得到了党中央的高度重视。与认为高职院校学生心理健康状况较好的传统观念不同,近年来高职院校出现心理危机事件频发、心理问题学生激增等现象。拟从政策及现状出发,探索出一条育人效果好、问题解决好、人员队伍强(两好一强)的“四位一体”心理健康教育体系。  [关 键 词] 政策;现状;两好一强  [中图分类号] G717 [文献
期刊