基于认知诊断的学生作答行为建模方法及应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mawenxing8155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着教育信息化进程不断推进,智能教育系统积累教与学数据呈现出加速增长的趋势。如何将数据分析挖掘技术应用于教育领域,从教育数据中挖掘有价值的信息,从而揭示教育的自然规律,指导老师、学生等教育主体优化教与学的方式方法,已经成为实现教育智能化的重要技术路径,也是《国家中长期教育改革和发展规划纲要》的重要目标。教育数据挖掘旨在利用教育领域不断累积的大量信息资源,构建可用的教育信息数据库,并在教育学理论指导下,设计新的数据挖掘技术,发掘有价值的教学规律,建立个性化的学生认知模型,为学生学习、老师教学、考试评测以及教育研究提供更科学的指导。在整个教-学-测的教育闭环中,为了有效地提高学生的学业水平,理解学生的学习能力与知识掌握水平成为最为关键的研究重点和难点,需要通过学生建模全面分析学生的学习能力、认知水平等特征。教育心理学将建模分析学生认知能力的过程称为学生认知诊断(Cognitive Diagnostic),对学生知识能力建模的方法统称为认知诊断模型(Cognitive Diagnosis Models)。本文在教育数据挖掘背景下,以认知诊断为理论核心,以学生作答行为建模为研究重心,开展以下三个方面的工作。首先,针对主客观题联合建模,提出了基于模糊认知诊断模型的学生能力建模框架。教育学测试一般通过设计和知识能力相关联的试题集考察学生的知识能力掌握水平。传统测试方法针对客观题(即是非题、选择题)上的学生测试记录,设计相应的认知诊断模型,然而这些方法对于主观题(即开放式的作答题)则无法进行相应的建模分析。另一方面,传统建模方法只能定性分析学生的具体知识能力,无法获得更加精确的量化信息。本文针对主观题得分存在部分正确的模糊性,在传统教育学假设下提出基于模糊认知诊断模型的学生能力建模框架,将学生的知识能力掌握水平表示为模糊集合的隶属度,在联结型和补偿型两种教育学假设下采用模糊交和模糊并来建模客观题和主观题上的认知作答模式,最后根据主客观题得分分布模拟学生作答得分的生成过程。本文提出的模糊认知诊断模型能对主客观题统一建模,并量化分析学生知识能力掌握水平。其次,针对作答得分异常检测,设计了基于认知诊断的线下学生粗心猜测侦测方法。线下学生测试需考虑粗心答错和猜测答对两种作答得分异常。传统方法一般将两种异常当作固定常数或者题目参数,无法分析学生作答记录中的粗心猜测因素。本文结合异常检测贝叶斯后验推断技术,提出基于认知诊断的粗心猜测侦测方法,首先基于异常检测方法从数据特点和认知诊断角度,提出基于p值的学生认知水平异常程度度量方法,借此来估计粗心猜测程度;其次本文根据学生作答模式的贝叶斯网络,基于认知诊断模型参数利用贝叶斯定理来估计粗心猜测程度;最后本文结合异常检测与贝叶斯后验推断技术来融合两种策略得到的结果,从而进一步提升粗心猜测侦测的准确率。最后,针对学生作答动机识别,发展了基于认知诊断模型的在线学生欺骗系统行为识别方法。理解学生作答行为动机是在线教辅平台中的研究重点。其中“欺骗系统”(即Gaming the System)是学生不依赖知识能力而利用系统本身缺陷来完成测试的行为,会影响到评测系统的有效性。传统建模方法一般将欺骗系统归为猜测行为,无法对欺骗系统行为进行针对性的认知建模分析。为此本文提出一种结合认知诊断的两步学生认知作答模型,从学生认知角度融入“欺骗因子”,利用在线评测多次尝试作答的数据记录,应用数据挖掘的方案来量化该因素的影响,并设计一套无监督的欺骗因子多指标聚合方法。再利用协同过滤算法推断单次尝试作答记录上的欺骗因子。最后基于信号侦测模型框架,融合每次作答的欺骗因子建立知识-欺骗二元学生作答模型。
其他文献
随着计算机技术和互联网的飞速发展,包括数字图像在内的各种多媒体数据的数量正在以惊人的速度增长,面对海量的多媒体信息,如何有效的管理、组织和利用有用的信息是一个关键
随着Internet的快速发展,信息资源数量的急剧增长,从而产生了信息爆炸的危机,Internet上的海量信息远远超乎人们的想象,并且海量信息没有体现其巨大的价值,有用的信息和无用
随着电信通信行业的快速发展,光纤通信网络的资源数量以指数型的趋势增长,光纤网络拓扑日渐复杂。各通信运营商对安全、高效的管理各类资源,从而给用户提供稳定的端到端服务
空调售后的修理与维护需要厂家提供足够的备件存储量,但是与此同时,过多的设备存储也会因否认过程中的氧化产生损耗而浪费不必要的存储费用。所以应当依据备件的使用历史来在最佳的一个数量范围内购置存放,来用最好的性价比保证空调的正常运转。此时用科学的算法来精准预测空调备件的消耗是针对这一症结的关键。备件预测控制在工业控制中体现了较大的优势和先进性,故而现今在工业过程控制中大量地引入了预测控制作为高端的计算控
伴随着我国经济的高速发展,我国电网技术的发展也十分迅猛,各种新型设备被引入电网,大区电网的互联也变成现实,在人们享受电网技术进步的同时,电网的潜在威胁也在变大。提高大电网安全稳定的运行水平已成为电网建设的基础性问题。母线负荷预测是动态状态估计、安全稳定分析、无功优化、厂站局部控制等的基础,是提高大电网安全稳定运行水平的一大工具。母线负荷预测的方法主要分为两大类:一类是基于系统负荷预测的预测方法,一
学位
本文主要工作是对椭圆曲线标量乘算法的研究,椭圆曲线标量乘算法是指一个大整数k乘以椭圆曲线上的一个点P,其研究点主要有两个,一个是算法效率,另一个是算法安全性。在效率方面,主
入侵检测是一种主动的网络安全防御措施,它不仅可以通过监测网络实现对内部攻击、外部攻击和误操作的实时保护,有效弥补防火墙的不足。而且还能够结合其他网络安全产品,对网
k跳可达性查询是图可达性查询问题的一般形式,在社交网络和传感器网络领域有很重要的应用。随着图数据的规模不断扩大,大图中的可达性查询问题受到了越来越多的关注。传统的
随着科学技术的不断进步,地质勘测的方法和手段也在不断推陈出新,其中采用钻井后数字摄像技术获取具有真实感的全孔壁图像进行地质分析已成为地质勘测的重要方法之一。目前,