论文部分内容阅读
选题策略是CD-CAT中非常关键的一个环节,需要在保证效率的同时尽可能提高测量精度。这也是CD-CAT中选题策略一直以来的发展主题。国内外学者对测验精度和题库利用率的关系探讨停留在理论层面。本文从实证层面探讨测验精度和题库利用率的关系,为选择合适的选题策略提供参考,并为今后的相关研究和认知诊断计算机自适应测验的发展提供指导。为了解决上述问题,本文采用蒙特卡洛(Monte Carlo)模拟方法并以DINA模型为例展开一系列的研究,包括一个预研究和四个正式实验:预研究采用文献分析法,选取了多篇同时含有测量精度和题库使用情况等数据的论文,探讨两者之间的关系。正式研究采用模拟研究法,考察KL、SHE、PWKL、PPWKL、MPWKL、HKL、PHKL七种选题策略的题库使用均匀性和测验精度的关系,并考察不同测验长度、属性数量、被试的分布、被试数量等因素对测验精度以及题库使用均匀性的影响。本文主要结论如下:(1)MPWKL和SHE的测量精度较高,如果综合测验精度和题库的利用率,PHKL、PPWKL比较好,其次是MPWKL。(2)总体上,综合测验精度和题库的使用均匀性指标,PHKL和PPWKL处在同一水平,为第一梯队,测验精度中等,题库使用率最高,综合表现最好;HKL和PWKL处在同一水平,为第二梯队,测验精度中等,题库使用率一般;SHE和MPWKL为第三梯队,测验精度最高,题库使用率最差;KL为第四梯队,测验精度低,题库使用率一般。(3)测验长度与测验精度成正比,与题库使用均匀性成反比。测验长度为16时,各种选题策略的综合表现最好。(4)被试数量对选题策略的测验精度和题库利用率影响较小。随着被试数量的增加,选题策略的测验精度先上升,被试数量达到1000后,变化平缓,题库使用均匀性综合指标先下降,被试数量为1000后,变化平缓。被试数量为1000时综合表现最好。(5)属性个数与选题策略的测验精度成反比。属性个数越少,各选题策略综合表现越好。(6)被试知识状态分布形态为负偏态分布时,测验精度最高。被试为正态分布时,SHE、PWKL、MPWKL、PHKL等选题策略的题库使用率最高。