论文部分内容阅读
本研究作为教育部“初中毕业与普通高中招生制度改革”项目2005年度数据分析的后续深入研究,在中考新课程改革的背景下,立足于我国的教育考试实践,以我国规模与影响力较大的教育测验之一——中考为例,收集了项目组试点的湖北省某地区课改实验区和非课改区考生在标准化中考数学科目考试试卷上的作答数据,开展了基于IRT等值的五种常用的项目参数等值方法的比较研究,并进而采用最佳的等值方法,将课改区和非课改区两组考生的能力估计值进行等值,从实证的角度对新课程改革实施的有效性进行了客观验证。
本等值研究的数据收集设计为共同题非等组设计,其中锚题内置,课改区和非课改区分别命制的两套试卷结构相同且含有共同题目,共同题目的得分包含在试卷总分中。试卷包含二分记分以及多步记分的题目,课改区和非课改区分别有6978和2348名考生作答相应的试卷。
本研究在数据处理时,采用三参数logistic模型(3PL)和分步记分IRT模型(PartialCredit Modal),使用Parscale 4.0版本程序进行参数估计。实施项目参数等化时,分别采用同时校准和分别校准方法,分别校准情况下使用Kolen&Brennan(2004)开发的STUIRT程序进行项目参数等化。
本研究采用大样本标准作为评价五种等值方法的检验标准,兼用其它检验标准,以测量学研究中最经常使用的统计指标RMSD作为等值方法精确性的操作性检验标准,主要得出了以下结论:
(1)不管是对于项目难度参数的等值,还是对于项目区分度参数的等值,平均数与标准差方法的误差最大,说明了当存在误差或违背假设条件时,其稳健性最差。
(2)对于项目难度参数的等值,同时校准方法的精确性和稳健性最强,其次是Stockingand Lord特征曲线方法。
(3)对于项目区分度参数的等值,平均数与平均数方法的精确性最好。
(4)利用同时校准方法,对课改区和非课改区考生能力进行等值,研究结果表明,参加新课程实验的考生的能力水平在统计上显著高于没有参加新课程的考生。当然,本研究只是尝试将测验等值的理论研究成果应用于中考课程改革的教育实践,倘若据此做出决策认为新课程必然优于老课程就未免失之武断。