论文部分内容阅读
依托于互联网技术的发展,越来越多的人开始关注网络教育。在网络教育考试中,由计算机去评判客观题得分的技术已经非常成熟,但是目前常用的主观题评分方式依旧采用人工方式,该方式极大地限制了网络教育的发展。因此研究并实现主观题自动评分系统对于提高网络教育的教学效率具有很重要的现实意义。本文以简答题评分作为研究重点,通过语言、语义提取文本特征,并在原有文本特征提取算法的基础上进行改进。构建以文本特征值为输入值,人工评分结果为输出值的样本集,通过PSO-BP神经网络构建主观题自动评分模型。基于文本特征提取、评分模型构建,进一步搭建主观题自动评分系统原型。论文的主要工作如下:本文首先进行语料收集与人工评分,收集西安电子科技大学网络与继续教育学院网络教育导论课程2018年秋季期末试卷,选取简答题,由专业评分人员进行评分,并按照一定格式存储到数据库中。其次,对N-Gram共现进行研究,将BLEU理论应用于简答题评分上,分别以文本、句子为单位计算词形相似度。实验结果显示,以文本为单位相对以句子为单位计算词形相似度其评分相关性高。针对N-Gram共现算法易受到常用词、短文本干扰的特点,提出改进的N-Gram共现算法。实验表明,基于改进的N-Gram共现计算词形相似度可以有效提高Quadratic Weight Kappa值。再次,对词向量及文本向量进行研究,通过课程知识点、简答题题库、维基百科语料构建向量训练语料库。利用Skip-Gram+NS模型训练词向量,利用PV-DM模型训练文本向量。根据多种文本向量表示方式,提取文本语义相似度特征。通过研究PV-DM模型存在的不足,对模型进行进一步改进。实验结果显示,利用改进后模型提取文本向量相似度特征其评分相关性相对改进前模型高。然后,通过提取的文本相似度特征以及文本长度特征来构建基于BP神经网络的自动评分模型。针对BP神经网络的不足,提出相应的改进方式。实验结果显示,基于PSO-BP神经网络模型预测评分其结果更接近于人工评分结果,更适应于主观题自动评分模型的构建。最后,构建主观题自动评分系统原型,并对系统各模块进行设计与实现,包括数据收集模块、文本特征提取模块、预测实现模块。