论文部分内容阅读
本研究以阅读测验为例,构建四种概化的研究设计,以测量条件标准误(Conditional Standard Error of Measurement)为指标,动态地显示概化设计在不同得分情况下的标准误,为概化设计与模拟真值间的比较提供客观标准。
一方面衡量四种概化设计的精确性,另一方面在概化D研究中对语篇量以及题目量进行调整,探讨语篇量与题目量对概化研究精确性的影响规律,从而获得最精确的语篇题目量设置方案,为测验编制者提供参考的信息。
研究结果发现:
第一,四种概化设计的条件标准误随被试得分水平呈现先上升后下降的倒U型趋势。
第二,设计p×i×h高估条件标准误的趋势,设计p×i、p×(i:h)和p×i1h有低估条件标准误的趋势。
第三,增加被试量可以提升设计p×i×h和设计pX(i:h)对条件标准误的精确性,但对设计p×i和pXi1h无明显影响。
第四,增加语篇量或者是语篇中的题量都可不同程度地降低概化设计对条件标准误的估计偏差、提升概化设计估计的精确性。首先,在固定总题量时,在中等语篇量下的估计偏差较小,在语篇量很小或很大时的估计偏差较大,但偏差变化幅度不明显。其次,在不固定总体量的情况下,增加语篇量或者语篇中的题量都能明显地提升概化设计对条件标准误的估计精确性。语篇量为4-6篇或是每篇语篇下的题量为3-6题时,概化设计对条件标准误的估计精度最高。最后,当同时调整语篇量或者是语篇下的题量时,当两者样本量都较小时,概化设计有轻微高估条件标准误的趋势;当语篇量适中、每篇题量为2-5题时,概化设计对条件标准误的估计偏差较小;当每篇语篇的题量达到5道以上时,概化设计表现出明显的低估。
第五,设计p×i和pXilh对低得分群体的CSEM估计较佳,而设计p×(i:h)对中等得分群体的CSEM估计较准确,而设计p×i×h在不同的分段上的CSEM波动较大。