论文部分内容阅读
目前,对于中文主观题的自动阅卷,由于其受到自然语言理解、模式识别等技术限制,至今国内仍无投入使用的系统。将计算机应用到主观题的阅卷中既可以减轻教师的繁重工作,提高工作效率,又可以促进自动答疑系统的发展。因此,研究如何实现主观题的自动阅卷具有很大的现实意义。本文的主要工作包括以下几个方面: (1)领域本体的构建。本文在“七步法”的基础上,借助一些权威教材和领域词典构建了数据结构这门课程的本体库,构建的本体库的规模为300个。并结合本体层次树的结构特点,从语义重合度、语义距离等因素综合考虑概念间的语义相似度,从而构建概念间语义相似度矩阵。 (2)文本相似度算法的改进。针对传统的向量空间模型不能揭示特征词间的潜在语义关系,本文通过本体库中概念间语义相似度矩阵对特征词权重进行调整,来增强领域特征词对文本的贡献程度,建立包含语义关系的参考答案和学生答案的向量空间模型,最后用余弦法得出两个文本的相似度。 (3)设计并实现主观题自动阅卷系统。该系统对数据结构这门学科,达到了较好的阅卷效果。且经过大量实验验证,该系统具有一定的可行性。