【摘 要】
:
本研究分为两个模拟研究。研究一以2009年和2010年科学学科监测的实际试卷结构和题目参数为基础,在共同题等值设计下对四种多维IRT等值方法进行了比较。研究二以更普遍的多维
【机 构】
:
教育部基础教育质量检测中心,北京,100875
【出 处】
:
第十届海峡两岸心理与教育测验学术研讨会暨全国教育与心理统计测量学术年会
论文部分内容阅读
本研究分为两个模拟研究。研究一以2009年和2010年科学学科监测的实际试卷结构和题目参数为基础,在共同题等值设计下对四种多维IRT等值方法进行了比较。研究二以更普遍的多维数据为基础,在共同题等值设计下比较了研究一中四种等值方法在不同铆题长度下的表现。所比较的多维IRT等值方法有MM,MS,TCF,ICF,研究一结果显示:(1)以实际数据为基础,TCF和ICF方法较一致,且误差较小。(2)对于能力参数,随着维度相关的增加,等值结果的准确性也增加。(3)在三个能力维度的等值结果中,维度2因为题目数量最少,所以等值效果最差。研究二结果显示:(1)TCF和ICF方法优于MM和MS方法,且表现较为稳定,不受铆题长度的影响。(2)在非等组和铆题长度较短的条件下,MM和MS的方法误差很大。
其他文献
本文拟用蒙特卡洛模拟方法生成两批数据,一批为条件独立数据,一批为条件相依数据. 通过运用CONQUEST软件和自编程序分析GT,MFRM,RBM,HRM在两批数据上的表现,以评分者偏差、变异
简单生活身高1.89米,体重90公斤,有着男模身材的刘翔,平时穿得最多的还是耐克,特别是成为耐克代言人以后,公司会有人送上门来。“方便是方便,但少了一种自己淘货的乐趣。”刘
本文拟在概化理论p×i非平衡设计下,比较三种缺失数据处理方法(类方差分析法、均值插补法和MCMC方法)在不同缺失率的情况下,对各个方差分量及其变异量的估计情况,并探究在不同情
Bootstrap方法是一种有放回的再抽样方法,该方法被认为是统计学上的新突破之一.Bootstrap方法的BCa方法和ABC方法既具有“可转换性”,又具有“二阶准确性”。为方便与其它方法
古巴老百姓都直呼其名 在古巴,老百姓喜欢谈论他们的领袖卡斯特罗,都亲切地叫他“菲德尔”或“我们的司令”,而不是称他“主席”或“书记”。古巴媒体也是如此,除非发布非常正式的官方新闻,一般都称呼他“司令”或“总司令”,有时干脆直呼其名——“菲德尔”。 起初,我觉得很别扭,问过很多古巴人:“你们这么称呼国家元首是不是太不礼貌?”而几乎所有古巴人的第一反应都是一愣,然后说:“我们历来这么称呼他。”
本研究的研究材料是该考试正式考试的3份试卷,选择适用于多级记分测验的等级反应模型,使用同时校准法、固定共同题参数法和链接独立校准法中的平均数标准差方法、平均数平均数
(1993年10月24日一届二次理事会会议通过)顾问:陈敏章曹泽毅董建华吴阶平马旭彭司勋陈文杰理事长:王镭副理事长:刘海林程伯基严世芸李荟元常务理事:(以姓氏笔划为序)万德光文历阳王谦
将题组GIRM (Testlet Response Thoery)方法和传统GT(Generalizability Theory)方法应用于实际研究,通过对实测数据进行分析,将题组GIRM方法与传统GT方法进行对比,来探讨题
本研究使用由“国际数学和科学评测趋势”改编的中国学生数学和科学素养测试中的小学生科学素养测验部分,根据全国代表性学生样本的实际作答,对量尺化测验矩阵设计的垂直量尺化
IRT方法是继Thurstone方法之后用于垂直等值的比较常用的一种方法。采用IRT方法必须满足两个前提假设:(1)测验在每个年级上都具有单维性,(2)各年级间测验结构相同。MIRT模型能