论文部分内容阅读
在语言行为测试中,考生分数易受评卷员效应的影响,控制评卷员效应对考生分数的效度与信度是十分重要的:本文用多侧NRasch模型分析了某省一次英语口语测试的主要的评卷员效应。研究结果表明,多层面Rasch模型可以很好的帮助研究评卷员效应,本研究中各个评卷员的严厉度是不同的。评卷员总体上表现出了集中趋势,总体上并耒表现出晕轮效应,但是四位评卷员出现了晕轮效应。同时,大部分评卷员在应用评分标准时,都表现了较好的内部一致性,但是也有两位评卷员的内部一致性超出了模型的预测范围。