英语写作中的自动评分与错误检测研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：anitalok

【摘要】

：

在大规模的英语考试中(如中考、高考、大学英语四六级考试、大学英语专业的四六八级考试、各个不同等级的成人考试等),写作都是必考。目前英语写作评分模式都是集中专业英语

【作者】

：

李亚丽

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

计算机辅助语言学习英语写作自动评分错误检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在大规模的英语考试中(如中考、高考、大学英语四六级考试、大学英语专业的四六八级考试、各个不同等级的成人考试等),写作都是必考。目前英语写作评分模式都是集中专业英语教师进行人工评分,但是随着参考人数的日益增加,人工评分的压力就越来越大。此外,英语写作的经常性训练也是提高写作水平的必经之路,这又需要大量人工进行评分和指正。本论文的研究目的就是使机器能够通过学习对作文评出可信的分数,并进行错误检测提供给学生反馈,从而降低人工评分在时间,人力方面的巨大消耗。　　本研究使用大学英语四级考试真实作文数据及真实评分,通过提取与写作相关的特征,进行机器学习,使得机器能够模拟人工评分对作文评出可信的分数。通过提取浅层信息(如文章长度,不同单词数,复杂单词数,平均词长,平均句长等),词衔接错误信息,句子错误信息,连接是否恰当、与题目的一致性,与满分作文的一致性,最相似作文所在分值、句法分析特征、从句特征、情态动词、被动语态等与作文写作水平相关的鉴别性特征,综合评判,给出一个最终的分数。通过特征提取,模型训练和测试,得到最终的打分结果为:与人工评分平均分差为1.83(总分为20分);2分内打分正确率达到70%;与人工评分之间的相关系数达到了0.88。　　本论文错误检测研究的目的是给写作者指出错误位置以供其改正,而不仅仅只给出一个分数。由于冠词和介词的使用是最常犯的错误,而且是占据错误比例最高的两种类型,我们着重对其进行分析。通过提取与冠词和介词相关的上下文特征,采用最大熵分类器自动学习,并采用语言模型后处理对结果进行修正,冠词自动检测结果交叉验证正确率达到76.9%,介词自动检测结果交叉验证正确率达到65.07%。本文在以下方面有所创新:　　 1.评分特征提取中,采用词序列和词性序列训练语言模型,并考虑上下文情况计算词间衔接错误比例,其特征值与人工打分的相关系数达到-O.52。　　 2.评分特征提取中,通过计算待评价作文与不同分值作文相似性,取相似性最大的作文分值作为特征,其特征值与人工打分的相关系数大于0.7。　　 3.通过统计不同词性出现在首词的比例,采用副词、动名词和代词的频率组合公式(RB+VBG)/(PRP+1)作为主位特征(其中RB、VBG和PRP为宾州树库标注语料集标注的词性),其特征值与人工打分的相关系数达到0.43。　　 4.评分特征提取中,采用语义类提取的方法进行近义词的提取,从而计算与题目关键词及其近义词的覆盖率。　　 5.评分特征提取中,提出采用分值上的平均特征取值来评价打分特征。　　 6.冠词和介词错误检测过程中,采用语言模型后处理的方法,对分类结果进行修正,分别提高了错误检测正确率绝对值1.9和2.7个百分点。

其他文献

牡丹图

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

牡丹图

复杂环境下基于传声器阵列的语音增强方法研究

现代信息社会对高质量的语音通信和自然语音交互系统的需求正在日益增加,尤其是搭载语音应用的免提式远讲语音通信和交互设备正在逐渐走进我们的生活。由于应用环境越来越复

学位

传声器阵列语音增强广义旁瓣抵消短时谱幅度估计混响抑制

基于多目视觉技术的大尺寸多点触摸屏设计与实现

随着人们对人机信息交换便捷性的要求越来越高，大尺寸、低成本触摸屏的市场需求将越来越强烈。基于计算机视觉的触摸技术只需使用清晰度较高的摄像机提取指尖点，可按需求扩大触

学位

光学触摸屏背景差分法肤色分割指尖定位卡尔曼滤波器多目视觉技术

AIRS探测大气温度廓线的优选通道敏感性研究

随着卫星探测技术的快速发展,高光谱大气探测技术已经广泛应用于大气遥感领域。Aqua卫星上装载的AIRS(Atmospheric Infrared Sounder)是最早的高光谱大气红外探测器,AIRS在3.

学位

大气遥感温度廓线优选通道分布迭代法敏感性

基于P波段机载SAR信号的干扰抑制算法研究

合成孔径雷达(SAR)图像中出现干扰条纹的原因是由电视、广播和各类通信系统辐射源的频率在系统带宽内,造成接受的信号中混有干扰信号。干扰抑制问题对提高图像质量有着重要的

学位

合成孔径雷达干扰抑制算法AR模型Kalman滤波P波段机载

大黄酸抑制高糖和血管紧张素Ⅱ诱导的大鼠近端肾小管上皮细胞肥大

目的:探讨大黄酸(Rhein)对高糖和血管紧张素Ⅱ(angiotensin，Ang Ⅱ)诱导的大鼠近端肾小管上皮细胞肥大的影响及其影响途径。方法:实验用SD大鼠。麻醉下，无菌分离单根近球小

学位

大黄酸高糖血管紧张素Ⅱ近端肾小管上皮细胞细胞肥大免疫细胞化学细胞增殖

个性化旅游服务推荐系统关键技术研究

个性化旅游服务推荐系统是克服在线旅游服务领域信息过载的重要技术。目前对个性化旅游服务推荐系统的研究还不成熟,主要问题包括:现有的多指标推荐算法预测精度达不到实用的

学位

个性化旅游服务推荐系统用户建模多指标评价信息过载

问荆(Equisetum arvense L.)水浸液对小麦生长的化感效应研究

问荆(Equisetum arvense L.)是一种多年生草本植物,属蕨类木贼科问荆属,在我国北方田间大量繁殖,其体内富含化感物质,会对小麦生长产生一定的影响。本研究采用生物测定法,研究问荆水浸液对3个不同品种小麦即龙麦36、龙麦30和龙麦35的种子萌发、幼苗生长及生理特性的影响,明晰问荆春枝、夏枝和根茎对不同小麦品种生长的化感效应,为筛选对问荆具有抗性的小麦品种、提高小麦产量和农业的可持续发展

学位

问荆小麦化感作用

基于不变特征的多源SAR图像匹配技术研究

图像匹配是从存在几何和灰度变化的两幅图像中提取同名点,是图像配准、图像镶嵌、图像检索、目标识别、立体匹配等众多领域的关键技术。SAR图像上的斑点噪声以及侧视成像等特

学位

多源SAR图像匹配技术不变特征尺度不变特征变换

汪强陶瓷艺术赏析

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

汪强艺术赏析陶瓷

英语写作中的自动评分与错误检测研究

与本文相关的学术论文