基于TextRank+Word2vec的主观题自动评分技术及其系统设计

来源 :昆明理工大学 | 被引量 : 4次 | 上传用户:kaigg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机辅助教学已经大范围的出现在课程教学中,但是现在通用的计算机阅卷技术都是针对客观选择题的,在主观问答题方面至今还没有一个大众接受的方法及适用的技术,由于主观题题型多样化、涉及学科领域较广等特点,主观题评分有一定的难度,也成为自然语言处理研究领域的热点。基于主观题评分方法新、技术多、实现难度大,至今还没有一个可广泛运用的主观题自动评分系统。为了减少研究难度,选择自然科学类课程主观题语料库为基础进行研究。本文实现了一个基于《系统建模与仿真》课程的主观题评分系统原型,第一,采用Jieba分词和维基百科停用词对文本进行处理;第二,将改进的TextRank算法用在提取关键词上,采用word2vec对提取的关键词进行向量化;第三,最后对向量进行余弦相似度的计算,将得到的结果作为评判分数的计算依据;第四,本文基于Django框架和mysql数据库设计了一个课程管理系统,实现了对题库、成绩等的管理。第五,基于课程构建了知识库,用word2vec将题库训练为词向量化的参考模型,并从题库中选取样本数据,并产生了100个答案数据,经过测试结果显示改进的关键词提取算法具有较高的准确率,将评分结果与老师评分的结果进行对比,发现设计的评分模块与人工评分的分值差距的标准差均在0.3周围浮动,得到的100个样本中有一半以上的评分误差在0.5以下,证明了在0.5的误差范围内自动评分在评分过程中可以被接受。本文使用了主观题评分相关理论实现了系统原型,证明采用的TextRank和word2vec关键技术可行,改进的提取关键词技术有效,实现的主观题评分系统原型说明了该系统具有一定实用性,对以后的研究具有一定参考价值。
其他文献
网络视频直播的应用越来越广泛,在外出直播时系统的便携性、可靠性、稳定性尤为重要。文中介绍了一套性价比较高的便携式网络视频直播系统,在实际工作中多次应用,取得很好的
涎腺腺样囊性癌是涎腺恶性肿瘤的一种,占涎腺恶性肿瘤的20%左右。它具有很强的浸润性和远处端转移能力,其远处转移率在口腔颌面恶性肿瘤中较高。肿瘤细胞持续不断的恶性增殖是肿
目的对近8年来笔者所在医院收治的劳力性热射病(exertionalheatstroke,EHS)和非劳力性热射病(classicheatstroke,CHS)患者临床资料进行比较分析、总结。方法收集2006年-2013年人住
随着太阳能晶硅电池制造业的竞争加剧,市场的日趋成熟,晶硅电池品质的要求也迅速提高。本文主要对目前先进的物联网、传感网络技术的研究,设计了基于安全物联网的自动化、智
共轭聚合物具有较强的光捕获能力,可用来放大荧光传感信号,在生物活性物质检测以及疾病诊断等方面的应用引起了人们的广泛关注。近年来,水溶性聚噻吩因其链构象及光物理性质
园林景观设计的人性化越来越成为人们关注的焦点,在园林景观中加入人性化的因素,可以让观赏者们心情舒畅。通过对人性化设计理念的学习,对人性化设计的理论和原则有一定的了
Link-22是“北约改进Link-11”(NILE)定义的新型战术数据链,一种抗电子干扰、保密可靠、灵活机动的超视距数字数据通信系统,以便最终取代Link-11和补充完善Link-16。其目的是
目的:研究综合护理干预应用在高血压合并冠心病患者中的护理效果。方法:选取2017年1月~2018年12月我院收治的100例高血压合并冠心病患者作为本次研究活动的观察对象,以随机数
埃塞俄比亚学生运动经历了不同的发展阶段,是时代变迁的“晴雨表”。1945年—1974年间,埃塞俄比亚教育尽管存在诸多问题,但它还是有了缓慢的发展。这期间,由于受教育人数增加、人民对教育的不满情绪滋长和社会危机的加深,学生走出校园激烈的反对塞拉西政权。其中,20世纪50年代,学生运动初露端倪,这一时期学生运动的特点是争取新闻出版自由和联盟自由;20世纪60年代末和70年代初,学生的反抗和政府的镇压在
通过测定8种植物粗提物对甘蓝蚜的趋避作用和触杀活性效果,筛选具有较强杀虫活性的植物提取物。8种植物提取物对甘蓝蚜均有一定的趋避活性和触杀作用,其中辣椒提取物对甘蓝蚜