大学英语作文智能评估与人工评估的对比分析

来源 :中国电力教育 | 被引量 : 0次 | 上传用户:chengyihan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:作文是大规模语言考试中的一种必考题型。通过作文可以检测应试者综合运用语言的能力。然而,由于疲劳因素、情感因素和不一致性,人工评阅作文具有很强的主观性,人工评估成绩在信度和效度方面存在着不可避免的问题。近几十年来,随着计算机硬件和软件性能快速提高,自然语言处理等技术获得了长足的发展,国内外一批作文自动评分系统相继问世,并被应用到英语写作测评中。本研究将作文自动评分系统给出的智能评估与人工评估进行对比分析,旨在探讨二者之间的吻合度以及二者对学生学习需求的满足程度,提出只有使电子智能有效地辅助人工评估,才能真实地测试出学生的实际语言应用能力,并帮助学生有效提高写作能力。
  关键词:英语作文自动评分系统;智能评估;人工评估
  作者简介:吴丹(1979-),女,湖北鄂州人,北京工业大学实验学院,讲师;张青妹(1972-),女,黑龙江哈尔滨人,北京工业大学实验学院,副教授。(北京 100024)
  中图分类号:G642.0     文献标识码:A     文章编号:1007-0079(2011)01- 0177-02
  
  一、研究背景
  要學好英语,写作起着极其重要的作用。国外的很多研究者也都认为写作是评价学习结果最有用的工具。学生需要通过不断的修改和练习,提高写作能力,但是作文评分与批改既费时又费力,给英语教师增加了沉重的负担。部分教师并没有足够的时间去批阅全部学生的作文,只能采取批阅部分学生的作文的方法,导致一些学生对写作作业采取敷衍的态度,打消了他们认真完成作业的积极性;还有的教师虽然能全部批阅学生作文,但是减少了学生练习写作的作业量,使学生不能充分应用其所学的语言及语篇知识。随着计算机多媒体技术在大学英语教学中的广泛使用,英语作文自动评分系统已成为广大英语教师改革英语教学手段和方法的切入点。英语作文自动评分系统在英语教学中的应用在一定程度上缓解了英语教师人工批阅作文的工作量,因而受到很多教师的青睐。然而,智能评估与人工评估是否具有一致性?二者是否都能满足学生的学习需求?人工评估是否能被智能评估完全替代?针对这些问题,我们对北京工业大学实验学院学生的英语作文进行教学实证研究。
  二、研究设计
  1.研究对象
  北京工业大学实验学院08级355名非英语专业大学二年级本科生和5位英语教师参与了本次实验活动。参与实验活动的学生经过一年多的大学英语学习,掌握了基本的英语段落展开方式,系统地学习了语篇知识和组织结构。参与实验活动的5名英语教师则一直工作在教学一线,积累了一定的教学经验,能够正确把握作文的命题与水平,并且公正地予以评估。
  2.研究工具
  我们这次实验研究的工具之一是学生调查问卷。问卷内容包括两个方面,共八个问题。第一部分调查学生对待智能评阅的看法,第二部分调查学生在写作评阅中的需求。调查问卷中的这八个问题都是封闭性问题,为多项选择题形式,要求学生根据自己的意愿做出选择。我们的另一个研究工具就是学生的作文样本。教师和自动评分系统会对这些作文分别进行评阅。分数等级是0~15分,评阅方式是整体评分。
  3.研究方法
  我们采用的作文自动评分系统是冰果英语智能评阅系统。冰果英语智能作文评阅系统是针对高等院校英语写作教学推出的机器自动评阅大批量学生作文的服务产品。目前,很多国内高校都在使用该系统。使用者普遍反馈,该系统能评出学生的实际写作水平。人工评估时,我们采用的是整体评估法,要求教师对学生的作文从语言、内容、篇章结构三个方面进行整体评分,并给出评语。
  我们首先对教师进行简单的培训,教会教师如何使用冰果智能评分系统。英语教师将作文题目和写作要求输入到系统中,每隔两周给学生布置1篇作文,作文体裁包括议论文、图表作文、书信作文和故事叙述。
  英语教师将布置的作文题目和要求输入到冰果智能评分系统后,会有一个相应的作文编号。学生可根据编号查到作文题目和要求。按要求完成作文后,学生将文章的电子版提交到系统中。在作文提交截止日期之后24小时内,系统会对学生的作文进行1分至15分的整体评分。而英语教师也将对学生所提交的英语作文进行评阅,教师只需在相应部分的分数后画勾,之后给出学生总体分数和各部分评语。为了保证人工评阅不受到作文智能平分系统的影响,智能评分系统的评分成绩由1名教师保管,只有在人工评阅全部完成后,教师们才能查阅智能系统的评分成绩。我们利用SPSS软件对这两种评估结果进行分析,探讨二者之间的相关性。对学生调查问卷的分析将有助于推断智能评估是否能完全取代人工评估。
  三、数据收集与分析
  1.智能评阅与人工评阅结果的对比分析
  我们收集了北京工业大学实验学院355名学生的1775份作文的电子文本,由智能评分系统和英语教师分别以整体评分的方式进行评分。为得到智能评阅系统与人工评阅之间的相关系数,我们比较了学生5篇作文的平均成绩,运用SPSS数据统计软件分析结果如表1。
  表1中的数据都可证明人工评阅与智能评阅系统评阅具有较高相关性。(1)平均数。统计学认为,平均数比中值更有效,因此作者选择两种测评工具的平均数作为一项指标。表中的两种评估工具的平均分差额均小于为0.2,可证明两者的相关性。(2)皮尔逊相关系数。皮尔逊相关系数>=0.01即为具有相关性,数字越大,相关性越强。我们从表中看到人工评估和电子软件评估的皮尔逊相关系数均大于0.6,显然二者之间具有显著的相关性。(3)意义指数。统计学指出,意义指数与相关性成反比,意义指数越高则相关性越低,完全正相关意义指数为0.001。本研究的意义指数0.002趋近于完全正相关意义指数0.001,可证明两种测评工具的相关性很高。(4)相关系数。相关系数是以往语言写作测试研究中较多采用的数据标准。Kroll指出相关系数0.8被普遍认定为语言写作测试中满意的标准,因此本研究的相关系数均值0.68可证明人工测评与电子软件测评具有较高相关性。
  2.调查问卷结果分析
  我们共发放学生问卷355份,收回有效问卷332份。调查结束后,根据每一项的次数分布和百分比,进行了简单的统计分析。
  (1)智能评阅与人工评阅的受欢迎度。就这一个方面我们为学生和教师设计了三个同样的问题:您最喜欢哪一种批阅方式?您对智能评分系统评阅作文的看法?您对智能评分系统评改作文的作用的看法?
  学生喜欢的评阅方式中,41.2%的学生表示喜欢教师批阅;55.1%的学生喜欢教师和智能评分系统分别批阅,还有3.7%的同学喜欢智能评分系统批阅作文。学生对于智能评分系统评阅作文的作用的看法有惊人的相似,98.6%的学生认为可以节省教师的时间,另有1.4%的学生认为智能评分系统可以促进写作。对于智能评分系统评阅作文的看法,有2.5%的学生认为是教师不负责任,27.2%的学生认为无所谓,70.3%的学生希望智能评阅能够坚持数年。
   由此可见,大部分学生能够接受由智能评分系统来评阅他们的作文,也认可智能评分系统的评分结果,但是对于智能评分系统是否真的能帮助他们提高写作能力持怀疑态度,学生仍然比较信任他们的老师。
  (2)学生的学习需求。就这一方面我们给学生设计了五个问题:您在英语写作中的困难是什么?您认为教师应对作文的哪些方面做出反馈?您希望作文的反馈途径是什么?您希望作文的反馈方式是什么?您希望教师如何对待您作文中的错误? 具体数据以百分比的形式,归纳在表2、表3、表4、表5、表6中。
  从以上表格中,我们不难发现学生在英语写作中的需求:学生认为他们写作中最大的困难是词汇和表达方式,希望教师在作文反馈中将它们置于首位;书面批阅是大多数学生的首选,还有略多于三分之一的学生希望能和老师直接交流;大部分学生不欣赏仅仅对他们的作文进行表扬或批评的方式,指出错误、改正错误和写评语是学生可以接受的评改方式。学生的学习需求差异很大,教师需要区别对待,有的学生偏爱指出错误,有的学生偏爱改正错误;略多于一半的学生在对待错误上达成共识,即没有必要对作文中的每一个错误做出反馈,但希望作文评阅是能重点指出部分错误。
  学生的这些需求反映出他们对教师如何评阅作文的渴求。尽管他们的有些观念需要转变,但这些需求间接地告诉了教师应该如何帮助学生提高他们的写作水平。作文评阅的过程实际上是师生之间的一个交流的过程。如果把这种交流的机会完全让给冷冰冰的智能评分软件,如何能达到教学相长的目的?
  现以一篇作文为例就不难看出完全依赖电脑来给作文一个准确的评判还不具备可行性。我们要求学生完成的一篇作文写作标题为“Shopping on the Internet”,要求学生按照以下汉语提示“网上购物逐渐兴起;阐述利弊”完成一篇120词左右的作文。某生得分10分(15分制),附加评语: A good piece of work. Your essay has some minor problems in accuracy but it is still mostly readable. You have a wide range of sentence structure and vocabulary. It's evident that you have covered the points required in your writing and showed strong writing skill. 这些评语乍看似乎很有针对性,但是对应作文中的句子 “shopping on the Internet is cheaper than the real-shop,that is the reason why people buy something on the Internet.” 以及 “And you can not touch the clothes or look it closely so that you might regret to buy it.”等,系統给出的评语“对句子结构和词汇有很好的把握”是不科学的。另外,该系统未能指出作文中的句子语法结构和单词拼写的错误。由此看来,尽管智能评估能够进行个性化评价,但是人工评阅更加具体,更能满足学生在写作评阅中的学习需求。
  四、结束语
  无论是从应试的角度来看还是从提高学生实际英语应用能力来看,提高学生的英语写作水平是件迫在眉睫的事情。学生需要做大量的写作练习来达到提高写作能力的目的。作文智能评分系统的问世无疑能解决英语教师欲布置大量练习却无力批改的难题。但是,学生更需要在作文评阅的过程中和教师进行书面或面对面的直接交流,因为机器是冷冰冰的,只有靠老师的点拨提携,学生才会有更大的进步。因此,教师应该将智能评分系统与人工评分结合起来使用,才能真正达到提高学生写作水平的目的。我们可以依靠智能评分系统达到让学生不断修改和练习写作的目的,而教师则应该围绕作文的语言质量、内容质量和篇章结构质量对作文进行人工评分,让学生充分了解自己作文的优势和缺陷。当然,如何将二者有效地结合起来使用,既节省教师的时间和精力,又满足学生的需求,这仍然是英语教师在教学实践中应该不断摸索的问题。
  
  参考文献:
  [1]葛诗利.中国学习者自动作文评分探索[J].外语界,2007,(5).
  [2]梁茂成.国外作文自动评分系统评述及启示[J].外语电化教学,2007,(10).
  [3]冰果英语智能作文评阅系统[EB/OL].http://www.Bingoenglish.com /ncewriting/index.Html,2009-10-06.
  [4]韩宁.几个英语作文自动评分系统的原理与评述[J].中国考试,2009,(3).
  (责任编辑:刘辉)
其他文献
用过Firefox的用户想必一定知道安装插件能为Firefox增加各种各样不同的功能,以强化原有的浏览器性能,因此广为Firefoxer乐道。也许是受此影响,微软最新发布的Internet Explorer 7.0(以下简称IE7)也开始支持插件功能。如果你目前正在使用IE7,并且对IE7原有功能感觉不满意,那么不妨就通过安装插件来扩展一下吧!
期刊
摘要:以安全电流、安全电压为起点,以规程为依据,以提高安全知识和安全意识为目的,简述了安全电流、安全电压及接触电压与接触电动势、跨步电压与跨步电动势的有关概念,并提出交流电气装置的接地标准中有待商榷的问题。  关键词:安全电流;安全电压;接触电压;跨步电压   作者简介:胡孔忠(1955-),男,安徽安庆人,安徽电气工程职业技术学院自动化及信息工程系,讲师;李淼(1967-),女,安徽宿州人,安徽
期刊
Q:我最近购买了一台宽屏液晶显示器,使用DVI线和显卡相连,但发现一个问题,就是在电脑启动时没有显示,显示器提示没有找到信号,但是进入到windows桌面后又显示正常了,请问这是什么问题呢?
期刊
IE 7.0正式版已经发布了一段时间,大家对它的新特性已经有所了解。插件支持在新版IE中得到了很大的强化,微软也推出了插件网站“www.ieaddons.com”。遗憾的是,不少IE插件并不好用,有很多甚至会出现安装错误。为此,笔者为大家精心测试了一批插件,并从中精选了几款,相信对强化你的IE大有作用。
期刊
摘要:根据上海电力学院实施的“电路分析”课程双语教学,从学生、教材和师资三方面阐述了双语教学的实践,研究了双语教学的教学方法、教学手段和教学内容,探讨了双语教学的必要性和可行性。教学实践表明,双语教学有助于提高学生专业英语水平,培养学生的综合应用能力。  关键词:双语教学;电路分析;教学方法  作者简介:刘蓉晖(1975-),女,湖南邵阳人,上海电力学院电力与自动化学院,讲师;杨尔滨(1958-)
期刊
摘要:通过分析智能变电站电子互感器在常规变电站的使用现状及其对线路纵差保护、变压器保护、母线保护的和电流的影响,概述了常规与电子式电流互感器二次合并单元的原理,同时对智能及常规互感器二次使用方法进行了探讨。  关键词:电子式互感器;合并单元;路由延时;光纤传输  作者简介:黄振宁(1982-),男,山东兖州人,山东电力超高压公司,工程师;惠杰(1979-),男,山东日照人,山东电力超高压公司,工程
期刊
前些时,一位朋友跟笔者诉苦:现在正写论文,好不容易在网上搜索到一些资料,发现都是PDF格式文件,转换成word文档后却变成了乱码!深有体会啊,虽然网络上有N多号称能“完美”将PDF转换成DOc文件的软件,但要是遭遇中文PDF就只能以乱码面对用户了。笔者曾经也对此问题抓耳挠腮,直到一次无意间使用“百度硬盘”程序,终于“豁然开朗”!!看到这里,相信很多读者朋友都大感惊奇了吧?现在笔者就来演示如何利用“
期刊
爆音/噪音是最常见的声卡故障,通常由以下原因引起。    声卡和芯片组冲突  这种故障通常发生在新声卡配老主板的时候,比如创新发布Audisy芯片声卡的时候,和VIA主板就有不合,出现爆音甚至跳音的问题,这些故障可以通过更新主板BIOS或者升级声卡驱动解决。
期刊
在2006年12月上的《电脑迷》杂志里曾介绍“让KMPlayer播放完毕自动关机”的方法,并提到KMPlayer没有提供直接设置的途径。其实,软件已经具备该功能,只是作者没发现罢了。
期刊
摘要:实现高职实践教学是高职教育的定位和本质要求,高职机械制造类专业(以下简称“机制专业”)是一个对实践教学要求较高的专业,因此,对实践教学方法的探讨成为当前研究工作的重点。根据理论及实践教学经验得出,在实训教学中实施行动导向教学法能有效促进学生的实践技能及综合职业能力的形成。因此,对行动导向教学法在机制专业实训教学应用的运用经验、实施策略及所遇到的问题等内容进行分析与探讨具有重要意义。  关键词
期刊