英语命题作文自动评分系统的研究与实现

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:csuzqc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英语作文自动评分(AES)是使用自然语言处理、统计学、人工智能等技术对作文进行评估和评分。其评分客观、公正,且不需要大量的人力与物力。目前国内广泛使用的句酷、冰果智能作文评阅系统,对作文的跑题评判效果都不够理想,而国外相关的技术和效果都没有公开,无法验证其实用性。因此,研究和实现一个能对作文跑题进行准确评分的系统有极其重要的意义。本文研究实现了一个英文作文自动评分系统,并对作文跑题评判进行了重点研究。由于目前还没有专门针对跑题作文的公开数据集,所以本文在Kaggle平台作文自动评分竞赛的公开数据集基础上,补充一部分内容充实、但是与主题无关的样本,根据样本的写作水平将其评分为0-2分,从而构建了一个包含1500条有标语料的数据集。提出一种简便的方法来提取英语作文主题词汇,并在此基础上,用作文主题词汇向量与待测作文词汇向量的余弦相似度作为衡量作文是否跑题的特征;接着分析作文的单词数量、句子数量、停用词数量等简单特征;在进一步分析作文的单词词性、N-Gram等语义相关的特征之后,用标记的语料训练模型;最后用该模型设计实现了英语命题作文自动评分系统。该系统简洁易用,能灵活的识别出批量作文的主题,并准确快速的对英语作文进行评分。本文对训练的模型以及设计实现的评分系统进行的详细的实验测试,测试结果显示,该模型能有效识别出跑题作文,其评分结果与人工评分具有很高的相关性和一致性。使用该系统分别对单篇(切题)作文、批量作文、跑题作文进行评分,结果显示系统性能良好。
其他文献
本文通过系统地剖析MODFLOW 的优缺点, 指出MODFLOW 应用广泛的原因在于它的实用性。而MODFLOW 的实用性又代表了未来地下水流数值模拟软件的发展趋势, 这也为我国的专业技术人员设计软件指明了方向
<正> 开封市地处豫东平原砂区,是我省花生的集中产区。历年来产量一直低而不稳,为了改变这种面貌,自1985年,由开封市农林科研所,农技站组织了“豫东平原砂区花生栽培技术规程
介绍了三维粒子技术的概况和特点以及运用三维动画软件MAYA制作台风和龙卷风的具体过程。在台风制作中,应用到了绘制粒子作为发射器添加涡旋场来模拟;在龙卷风制作中,运用了b
浓度是表征介质溶液特征的重要参量之一,对溶液浓度的测量与控制在造纸、化工、制糖、食品、制药等行业中有着广泛的应用,它是保证产品质量和提高产品质量的重要技术手段。有
研究了隧道监控量测结果在围岩动态分级中的应用.通过对隧道监测数据的统计分析,得出了对围岩动态分级具有意义的指标和各级围岩所对应的各指标的数值范围,用以指导施工阶段
有着浓厚民族情感和"家国同构"意识的中国作家,通过小说叙事自然地将家族兴衰史与国家命运历程紧密相连。在他们创作的中国现代家族背景小说中,通过展示叛逆者形象对封建家长
本文利用姑山铁矿区疏干工程的实际资料,介绍多层地下水矿区放水孔和坑道疏干的一种数值方法,取得满意的结果。
随着计算机网络和多媒体技术的发展,社会对视频监控的需求范围不断扩大,监控系统正由传统的安防监控向管理监控和生产经营监控发展。监控系统功能的设计和实现是决定一个监控
尾矿库是矿山的一个重大危险源,需要引起人们的重视,但目前,国内外在系统完善地评价尾矿库的安全性这一方面,做的尚未不够。本论文参考了国家、部门、行业颁布和制定的法律、
工程测量中,为确定物体表面的形状,通常需要在多个测站上观测物体表面上均匀分布的离散点坐标,而各测站的站心坐标系指向并不一致。本论文讲述了离散点在不同站心地平坐标系