认知诊断测验编制的新方法

来源 :中国心理学会 | 被引量 : 0次 | 上传用户:wy85396021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  认知诊断不仅要给被试提供一个总分而且还要提供其属性掌握模式。欲达到比较准确地诊断出被试的属性掌握模式(又称为知识状态)的目的,如何编制一个好的认知诊断测验(CDT)就显得尤为重要。有关CDT的测验编制文献不多、方法也不太具体的一个原因是没有像项目反应理论中用以衡量测量精度的Fisher信息函数量。本文提出了一种新的认知诊断测验编制方法。这种方法克服了Henson和Douglas (2005)编制的测验没有控制属性水平的信息,使用的测验Q矩阵也不是充分必要Q阵(丁树良,汪文义,杨淑群,2011)这两个缺陷。本文提出一个新的指标且考虑属性层级方法(AHM,Gierl,Lieghton,Hunka,2004)的四种不同的层级结构(线型,收敛型,发散型,无结构型)。由于属性层级是偏序关系,所以组卷入选的项目是在某个集合内选取,而这个集合以两类被试认知状态的交集和并集作为集合的上下界,至于选取哪个项目类是看该项目是否满足提出的指标。该方法既考虑了测验里包含可达阵又考虑了属性水平的信息。通过模拟,本文提出组卷方法比Henson和Douglas提出的测验编制方法好,模式判准率大大提高。
其他文献
在学习过程中对学习过的知识进行尝试回忆测验,称为“提取测验”。二十世纪七十年代Roediger和Karpicke等人就学习(S)与提取测验(T)的不同程序组合对知识长时保持效果的影响进行了大量的研究,研究结果表明,学习与提取测验交替进行( STST)的程序组合识记材料的长时保持效果最好。在此基础上,作者以250名大学生为被试,学习(S)任务是20个拉丁文单词及与之对应的汉语词汇的对偶联想学习,提取
概念转变是认知发展与教育领域的热点话题之一,但关于小学生热概念的转变研究仍处于萌芽阶段。本研究抽取了某小学一、三、六年级学生共104名,采用三种情境任务考察了他们在热概念方面的认识水平。研究发现:一年级学生一方面将热看作一种物质,同时又用物质模型理解热作为一个过程概念具有的速度属性。三年级学生基本将热看作一种过程,主要体现在能够正确认识速度和方向两个重要属性。六年级学生对于热作为一个过程概念所应具
研究旨在探讨反应指导语、评分方式、测验的开发模式对情景判断测验效度的影响,以为编制高效度的情景判断测验提供技术指导。研究设置了典型行为指导语和最佳行为指导语两种反应指导语,最大离差和统一离差两种评分方式,绩效导向开发、结构导向开发、绩效与结构结合导向开发三种模式,研究结果发现:(1)反应指导语对情景判断测验结构效度的影响因测验所测特质的不同而改变。典型反应指导语有利于测人格的情景判断测验效度的提高
认知诊断测验的分析需要两类模型:认知模型和认知诊断模型.Gierl,Leighton,和Hunka (2004),TatSuoka(1995)认为,作为认知诊断的认知模型包括属性及其层级关系.本文欲讨论被试反应数据(观察反应模式,ORP)和认知模型的拟合问题.这里至少有两种解决方案.第一种是尽量清洗带有噪音的ORP(余下的ORP记为CORP);用CORP和期望反应模式(ERP)的"距离"度量它们之
情景(scene)是真实世界中各个分散的刺激物及其背景构成的、具有语义一致性的视觉图景。对情景的识别,直接影响着人们的日常生活。本研究以15-23岁的青少年为被试,通过两个实验考察了青少年对快速呈现情景的识别及背景信息的影响。实验一采用了4(呈现时间:62ms、97ms、 132ms、167ms)×3(年龄阶段:15-17、18-20、21-23)混合实验设计。结果发现: (1)在快速呈现条件下,
本研究对小学3、4年级的285名儿童进行了3年追踪调查,探讨了儿童的外部攻击、关系攻击和安静退缩行为对他们分别与男、女生互选友谊数的影响。结果表明:(1)儿童的外部攻击对他们在各时间点测得的与男生的互选友谊数的消极影响接近显著水平,而对他们与女生的互选友谊数则有显著的消极影响。初始时拥有较多的男生互选友谊数可以弱化外部攻击对儿童与男生互选友谊数的消极影响;与女生相比,若男生表现出较多的外部攻击行为
多维项目反应理论是单维项目反应理论在多维空间中的推广和发展。多维项目反应理论研究和应用的一大技术难点是项目参数估计。本研究以多维补偿性项目反应模型——三参数多维正态肩型曲线模型为例,采用蒙特卡洛模拟(MC)方法比较了边际极大似然估计法(MML)、MCMC (Monte Carlo Markov Chain)法和因素分析结果间接转换法三种项目参数估计方法在不同条件下估计质量的优劣。
经典IRT对LID的严重依赖阻碍了其在大量基于题组的测验中的应用,相应地,基于经典IRT的DIF分析方法都没有考虑到LID的影响。本研究基于三参数题组模型(Howard Wainer,2000)和两因子多维题组反应DIF侦测模型(Hiirotaka Fukuhara,2009)提出三参数题组DIF侦测模型。同时,采用MCMC方法自编了该模型的参数估计程序,模拟研究表明:自编程序对模型参数估计精度较
认知诊断计算机化自适应测验(Cognitive Diagnostic Computerized AdaptiveTesting,CD-CAT)是对CAT的扩展,其目的是对被试在测验所测属性(如任务、子任务、认知过程和技能)上的掌握水平进行诊断和分类。本论文旨在回顾并总结近十年来国内外学者在CD-CAT的组成部分,即认知诊断模型、参数己标定的题库、初始项目的选择、选题策略、知识状态估计方法与终止规则
由于特定的测量目的,有些人格、态度量表需要采用迫选的计分方式,或者在能力量表中客观题一般是0-1计分。然而,由于二级计分的数据结构不符合传统的探索性和验证性因素分析的前提假设,这类量表并不适宜使用传统的因素分析方法进行维度结构的探索和验证分析。本研究首先介绍潜在类别分析的方法拓展应用于二级计分量表因素分析的理论基础和统计思路;然后以EPQ数据为例,比较传统的因素分析和基于潜在类别模型的因素分析方法