论文部分内容阅读
现在,越来越多的国内外专家注重教育与心理测量中的公平性问题的研究,因此,项目功能差异研究(DIF)已经成为国内外教育与心理测量界的研究热点。本文运用模拟研究,在2PLM模型下,在样本容量一致、DIF量存在低、中、高三种水平的条件下,比较了常用的三种DIF侦测方法——MIMIC方法、MH方法和Logistic Regression方法的检验能力。结果表明:1、DIF侦测方法对I类错误有较显著的影响。三种方法中,MIMIC方法的I类错误率最低,MH方法的I类错误率其次,LR方法的I类错误率最高。2、MH方法侦测DIF时,当DIF值为0.55时,统计检验力最高,当DIF值为0.85时,统计检验力其次,当DIF值为0.25时,检验力最差。3、Logistic regression方法在侦测DIF时,统计检验力随着DIF值的增大,而增大。当DIF值为0.85时,统计检验力最高,当DIF值为0.55时,统计检验力其次,当DIF值为0.25时,统计检验力最差。4、MIMIC方法在侦测DIF时,当DIF值为0.55时,统计检验力最高,当DIF值为0.85时,统计检验力其次,当DIF值为0.25时,统计检验力最差。5、当DIF值为0.25时,MIMIC方法的统计检验力最高,I类错误率最低;Logistic regression方法的统计检验力其次,I类错误率其次;MH方法的统计检验力最差,I类错误率最高。6、当DIF值为0.55时,Logistic regression和MIMIC方法的统计检验力不分伯仲,MH方法的统计检验力相比之下,稍差一些,但是,Logistic regression方法的I类错误率最高,其次是MH方法,MIMIC方法的I类错误率最低。7、当DIF值为0.85时,MH方法的检验统计力稍差,Logistic regression和MIMIC方法的统计检验力差不多,但是对于I类错误率,Logistic regression方法的I类错误率最高,其次是MH方法,MIMIC方法的I类错误率最低。