被试能力估计方法的比较

来源 :中国心理学会,中国教育学会 | 被引量 : 0次 | 上传用户:billyte
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在CAT模拟过程中,使用的能力估计方法有极大似然估计方法(MLE方法),期望后验估计方法(EAPE方法).当被试在CAT初始阶段前三题正常作答时,MLE能力估计方法在各个能力水平上都具有较好地模拟返真性能,模拟返真性能优于EAPE能力估计方法的三种变式方法;而对于三种EAPE能力估计方法,只有当被试能力真值在0附近时模拟返真性能良好;而在能力区间的高端和低端,EAPE方法的模拟返真性能较差,而且在CAT整个测试过程中,EAPE-N(0,0.5)方法的模拟返真性能要稍微劣于EAPE-N(0,1)方法,EAPE-N(0,1)方法要差于EAPE-N(0,2)方法。
其他文献
本文结合国内外的研究,概述了认知诊断理论在心理与教育测量研究中应用的研究成果,主要从认知诊断模型的选择、认知诊断测验的编制、认知诊断的应用的具体方向三个方面来进行论述,并展望了今后的研究趋势.
本研究借鉴van derLinden的局部等值的思想,提出基于认知诊断模型等值方法(CDM-LEM)对观测分数进行等值.第一部分为理论研究部分,证明了基于认知诊断模型的真等值转换族满足等值的公平、总体不变以及对称性的要求。第二部分介绍CDM-LEM如何估计真等值转换族以及计算每个受测者的等值分数。研究结果发现CDM-LEM在存在组间差异时的偏差与标准条件下几乎没有差异。与基于项目反应模型的局部等值
本文结合属性层级结构提出新的选题指标,根据新的选题指标确定能有效区分被试的项目类。然后根据所选择的项目类次数和考察属性次数,计算各个项目类的属性提供的信息,由提供信息的多寡去决定项目类中项目的个数,同时适当地把可达阵放入测验中进行组卷。所以,组卷方法由待选项目类集合的确定、选取项目类指标、考察属性、组卷等四个部分组成。模拟研究表明,本文的组卷方法比Henson等的方法模式判准率大大提高。
本研究以小学数学为测验内容,重点测验了圆柱与圆锥这一章节的知识属性,用20道选择题测查了六项基本属性,将采用触合模型作为认知诊断的方法,估计被试的掌握模式和项目参数。初步分析结果显示,本次测验的20道题目从参数估计的结果角度来看质量参差不齐,被试对圆柱的初步认识、圆柱的表面积、圆柱的体积、圆锥的初步认识4个属性的掌握情况较好,对圆柱的综合应用和圆柱和圆锥的综合应用2个属性的掌握情况一般,学生和教师
本文在借鉴现有选题策略优缺点的基础上引入三种新的选题策略:KLED选题方法,基于二分法的选题策略(HA)及特随机成分HA(RHA)选题策略。为了比较KLED,HA,RHA,SHE,ED,后验加权KL(PWKL),KL和随机选题策略(RD)的表现,采用模拟研究进行验证。研究结果显示:从知识状态准确性来看,KLED,ED,PWKL与SHE相当,其次是HA,再次是RHA,KL较差,RD最差;从项目曝光控
在计算机化自适应测验中,a-STR是较为独特且运用较广的一种选题策略,针对a-STR分层数固定不变,提出了动态a分层方法(DAS).本文针对DAS的不足,对DAS进行修改,形成基于MIS的DMIS。在此基础上,对DMIS引入曝光因子,形成了引入曝光因子的最大信息量动态分层策略,即DMIS-ecf。DMIS-ecf每阶段选题策略不限于难度匹配法,因此设定了三种不同阶段选题策略的方法。计算机模拟结果显
本文在程氏选题法的基础上提出以平均信息量替代程氏选题法中的信息量的改进方法,称为极大平均信息量选题法(MAIS).同时还注意到MAIS选题时每次从题库选取难度与“极大信息量”相匹配的试题,进而考虑在MATS基础上在选题时做点优化,称这种改进的选题策略为优化的极大平均信息量选题法(OMAIS).显然,OMAIS与MAIS相比,前者的计算量要比后者的计算量大大减少。实验数据表明,当题库中试题难度服从标
本研究通过模拟研究比较在教育与心理学领域较为常用的三种聚类方法,即K-means方法、潜在类别模型和混合Rasch的聚类效果。结果表明:(1)潜在类别数量、变量数量、样本量、样本平衡和变量间相关对K-means方法、潜在类别模型和混合Rasch模型的分类准确性均有影响且因素间的交互作用存在。(2)除了在2个潜在类别的样本不平衡条件下K-means方法表现较差外,在其他条件下与潜在类别模型和混合Ra
本研究将Rasch题组DIF检验方法和MIMIC方法用于题组DIF检验中,使用模拟研究的方法了解Rasch题组DIF检验方法在针对题组测验的DIF检验中参数估计的精确度、不同条件下的DIF检验力和犯I类错误的概率,并且对Rasch题组DIF检验方法和MIMIC方法进行比较,找寻在不同条件下更为适用的题组DIF检验方法,为在题组测验的DIF检验中选择更加适合的条件.根据对Rasch题组DIF检验方法
本研究依据Chien(2008)的做法对GIRM模型进行了改良,并将改良后的方差分量估计方法称之为GIRM方法,并将其应用到p×i设计的模拟数据中,探讨在不同参数分布形态下G1RM方法和传统GT方法的适用性。结论:1、在不同被试能力分布情况下,两种方法对于σ2(p)所得结果有所差异,GIRM在大部分情况下对方法σ2(P)估计的准确性略差于传统GT方法。2.在不同题目难度分布情况下,两种方法对于σ2