论文部分内容阅读
随着教育信息化进程不断推进,智能教育系统积累教与学数据呈现出加速增长的趋势。如何将数据分析挖掘技术应用于教育领域,从教育数据中挖掘有价值的信息,从而揭示教育的自然规律,指导老师、学生等教育主体优化教与学的方式方法,已经成为实现教育智能化的重要技术路径,也是《国家中长期教育改革和发展规划纲要》的重要目标。教育数据挖掘旨在利用教育领域不断累积的大量信息资源,构建可用的教育信息数据库,并在教育学理论指导下,设计新的数据挖掘技术,发掘有价值的教学规律,建立个性化的学生认知模型,为学生学习、老师教学、考试评测以及教育研究提供更科学的指导。在整个教-学-测的教育闭环中,为了有效地提高学生的学业水平,理解学生的学习能力与知识掌握水平成为最为关键的研究重点和难点,需要通过学生建模全面分析学生的学习能力、认知水平等特征。教育心理学将建模分析学生认知能力的过程称为学生认知诊断(Cognitive Diagnostic),对学生知识能力建模的方法统称为认知诊断模型(Cognitive Diagnosis Models)。本文在教育数据挖掘背景下,以认知诊断为理论核心,以学生作答行为建模为研究重心,开展以下三个方面的工作。首先,针对主客观题联合建模,提出了基于模糊认知诊断模型的学生能力建模框架。教育学测试一般通过设计和知识能力相关联的试题集考察学生的知识能力掌握水平。传统测试方法针对客观题(即是非题、选择题)上的学生测试记录,设计相应的认知诊断模型,然而这些方法对于主观题(即开放式的作答题)则无法进行相应的建模分析。另一方面,传统建模方法只能定性分析学生的具体知识能力,无法获得更加精确的量化信息。本文针对主观题得分存在部分正确的模糊性,在传统教育学假设下提出基于模糊认知诊断模型的学生能力建模框架,将学生的知识能力掌握水平表示为模糊集合的隶属度,在联结型和补偿型两种教育学假设下采用模糊交和模糊并来建模客观题和主观题上的认知作答模式,最后根据主客观题得分分布模拟学生作答得分的生成过程。本文提出的模糊认知诊断模型能对主客观题统一建模,并量化分析学生知识能力掌握水平。其次,针对作答得分异常检测,设计了基于认知诊断的线下学生粗心猜测侦测方法。线下学生测试需考虑粗心答错和猜测答对两种作答得分异常。传统方法一般将两种异常当作固定常数或者题目参数,无法分析学生作答记录中的粗心猜测因素。本文结合异常检测贝叶斯后验推断技术,提出基于认知诊断的粗心猜测侦测方法,首先基于异常检测方法从数据特点和认知诊断角度,提出基于p值的学生认知水平异常程度度量方法,借此来估计粗心猜测程度;其次本文根据学生作答模式的贝叶斯网络,基于认知诊断模型参数利用贝叶斯定理来估计粗心猜测程度;最后本文结合异常检测与贝叶斯后验推断技术来融合两种策略得到的结果,从而进一步提升粗心猜测侦测的准确率。最后,针对学生作答动机识别,发展了基于认知诊断模型的在线学生欺骗系统行为识别方法。理解学生作答行为动机是在线教辅平台中的研究重点。其中“欺骗系统”(即Gaming the System)是学生不依赖知识能力而利用系统本身缺陷来完成测试的行为,会影响到评测系统的有效性。传统建模方法一般将欺骗系统归为猜测行为,无法对欺骗系统行为进行针对性的认知建模分析。为此本文提出一种结合认知诊断的两步学生认知作答模型,从学生认知角度融入“欺骗因子”,利用在线评测多次尝试作答的数据记录,应用数据挖掘的方案来量化该因素的影响,并设计一套无监督的欺骗因子多指标聚合方法。再利用协同过滤算法推断单次尝试作答记录上的欺骗因子。最后基于信号侦测模型框架,融合每次作答的欺骗因子建立知识-欺骗二元学生作答模型。