可修改答案的CD-CAT的研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:xiaoxie20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
和以往的纸笔测验(Paper And Pencil Based Test,P&P)相比计算机化自适应测验(Computerized Adaptive Testing,CAT)根据被试的作答反应自适应地选择题目,CAT既减少了测验的长度,并且显著提高了测验的精度。认知诊断计算机化自适应测验(Cognitive Diagnostic Computerized Adaptive Testing,CD-CAT)是认知诊断理论和计算机化自适应测验的理论相结合的产物,它不仅具有CAT的特点,同时还具有诊断的功能,CD-CAT旨在对个体的认知过程、加工技能或知识结构进行诊断,从而为后续的补救性教学提供有效的借鉴,它更强调考察被试内部的加工过程。然而,目前绝大多数CAT和CD-CAT不允许被试修改答案,研究者主要担心修改答案会降低它们的有效性。允许修改答案符合被试一贯的测验习惯,修改之后的分数更能反映被试真实的水平,从而能够进一步促进CAT和CD-CAT在实际中的应用。已有的研究主要从三个方面提出了可修改答案CAT的控制方法:一是测验设计;二是改进选题策略;三是建构模型。Han(2013)提出的题目口袋法(Item Pocket,IP)是目前具有较好应用前景的可修改答案的CAT(Reviewable CAT)控制方法,IP法的思路是计算机为被试提供了一种题目口袋选择,即允许被试作答过程中,随时可以把待修改的题目或者暂时想跳过的题目放入IP中,然后接着作答下一个题目,放入IP内的题目不参与当前能力估计。当IP容量已满后,被试需要替换一题才能再次放入。IP法的缺点是其容量不容易控制,容量过大将导致较大的估计误差。本文在IP方法的基础之上加以改进,提出了新计分的题目口袋法(Modified IP,MIP),即对放入IP内修改的题目重新计分。与IP法相比,Stocking(1997)的设计对修改行为有较多的限制,Stocking设计1允许考生在答完所有题目后,返回修改固定数量的题目,修改后的作答并没有体现在自适应选题中;Stocking设计2是允许被试修改单独限时题目单元内的答案。在测验过程中将题目按照先后顺序划分为固定长度的题目单元,题目单元长度根据实际需要而规定。被试可以在单元内对题目进行检查并修改,计算机根据被试当前单元的作答来选择下一个单元,提交答案后的单元不允许再次返回修改。与Stocking设计一相比,被试在Stocking设计二中对测验有更多的掌控,不管测验被分割为多少个小单元,被试还可以修改所有的题目,但设计一中只能修改固定数量的题目。另外设计二中被试修改单元内答案会影响下一个单元的选择,计算机会根据被试修改后的能力估计值选择下一个单元。而设计一中修改题目之后的能力估计值并没有体现在自适应选题上。从这点来看设计二要比设计一更符合CAT的规则。以上几种修改答案的设计方法在CAT的应用中各有优缺点(IP、MIP、Stocking设计1和Stocking设计2),CD-CAT是由CAT的进一步发展而来,但两者之间又有很大的区别,为了验证上述方法在可修改答案的CD-CAT(Reviewable Cognitive Diagnostic Computerized Adaptive Testing,RCD-CAT)的效果,模拟研究分别采用了DINA和R-RUM模型,假设被试知识状态和题库都服从均匀分布,模拟生成5000个被试,300容量的题库,知识状态的估计采用极大似然估计方法(Maximum Likelihood Estimation,MLE),属性考察个数分别是5个和7个,选题策略包括:Kullback Leibler(KL)、Posterior Weighted KL(PWKL)、Hybrid KL(HKL)和Modified Posterior-Weighted KL(MPWKL),测验长度分为10题和20题。通过通过蒙特卡洛模拟研究发现:第一,与传统不修改答案的CD-CAT相比,本文提到的RCD-CAT方法,可以在不损失诊断精度和题库曝光率的基础上,允许学生修改答案,这符合学生一般作答行为习惯,减少学生做答的负担及焦虑程度,更易被大众接受。第二,当研究采用了DINA模型的时候,MIP法和IP法的效果没有太大区别,结果表明MIP的效果依赖于被试的作答概率分布。第三,在所有的研究条件下,Stocking设计的模式判准率要高于其他三种方法,其中,Stocking设计2的模式判准率略微优于Stocking设计1,结果表明Stocking设计在RCD-CAT的应用中具有良好的前景。总之,RCD-CAT不仅符合被试一贯的测验习惯,并且通过修改答案有助于提高诊断的准确率,进一步而言本研究有助于进一步为RCD-CAT和RCAT的研究和实践应用提供理论和方法支持。
其他文献
我们每天要做很多决策,即使不总是追求最佳决策,但也常常寻求令人满意的决策。个体在进行决策评价时,经常会遇到的消极情绪就是后悔,决策的数量造就了后悔的空间。事实上,后
无论是看到的真实还是看不到的真实,最重要的是要在作品里面有精神点,因为精神是可以审美的,通过审美我们是可以交流的,唯有精神可以交流,没有精神的话,单纯一个技术,人们永
多样化课堂是相对于传统单一的物理课堂而言的,是构建高效课堂顺利实现的关键因素,更是促使学生健全发展的基础。众所周知,以往的物理教学采取的都是简单的知识灌输式教学模
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
随着新课程理念的不断深入和推广,对于高中英语课堂有效教学策略的研究必须引起广大教育工作者的重视,而且要在总结教学经验的基础上,不断加强教学模式、方法的创新和应用。
本研究主要描述了大学生的焦虑情况,并考察了高焦虑大学生的情绪调节内隐态度的特点,以及不同情绪调节内隐态度对情绪调节的影响,并考察团体沙盘游戏对焦虑大学生的干预效果
大秦线电气化铁道远动系统采用了牵引供电、电力、通信、信号四电合一的综合调度系统,本文针对该系统的构成、功能及特点进行简要分析,并展望四电合一综合调度系统的应用前景
当前,素质教育是教育的首要目标,它要求教师把学生从应试教育中解放出来,真正成为全面发展的有用人才。因此,教育界再次出现了“百花齐放,百家争鸣”的理论研究气氛,忽视了多
作为中国自主品牌第一款燃油缸内直喷涡轮增压发动机,在技术上已经达到了国际先进水准,无论在动力输出还是燃油经济性上都可圈可点。
特高压交流电网是长距离大范围平衡能源供需、建设坚强智能电网和全球能源互联网的关键。特高压交流电网正在稳步发展中,无功电压控制是保证特高压交流电网安全可靠经济运行