论文部分内容阅读
摘要:本研究采用SIBTEST软件对河南省英语中招试卷中的客观题部分进行城乡生源方面项目偏差分析,试图回答:(1)该试卷中75个客观题在城乡生源方面是否存在项目功能差异;(2)该试卷中5个语篇在城乡生源方面是否存在项目束功能差异。研究发现:(1)该试卷中的第32题和第36题存在明显的城乡生源项目功能差异,对农村考生不利;且第32题β绝对值已经超过0.88,表明32题已经不宜采用,而第36题在选用时需考虑,仍可以采用;(2)该试卷中第3篇阅读理解语篇项目束的β值较各个分项有明显放大,这表明,虽然各个分项中没能显示针对城乡生源的项目功能差异,但从整个语篇角度观察,该语篇对农村考生明显不利,存在明显的项目束功能差异;而其他四个语篇未发现存在项目束功能差异。
关键词:河南省中考英语试卷;城乡生源;项目功能差异;公平性
一、 引言
任何一个大规模,高风险的考试的公平与否对考试研发机构,组织实施机构,所有的考试利益相关者,乃至整个社会都会有重要的影响。中招英语考试作为选拔性考试,事关考生的命运,事关政府部门的公信力,对整个社会都影响巨大。河南省每年中招考试参与人数都数以十万计,如此一項大规模,高风险测试,许多潜在的因素都可能会影响到测试的信度和效度,对考试公平性和有效性产生潜在影响,进而产生难以估量的社会效应。
项目功能差异(Differential Item Functioning,简称DIF)检验方法是常用的用来检验测试公平性的统计方法。DIF是指,对于某个特定项目,如果在来自同一目标特质的两批平行被试组中,显现出不同的统计特性,那么该项目就存在功能差异。(董圣鸿,马世晔,2001)“同一目标特质的两批平行被试组”是指在测验打算测查的能力(目标特质)上,两组被试具有相同的水平。在DIF的实际研究中,常会人为地把被试分为两组,分别称为参照组和目标组。
二、 文献综述
项目功能差异的检测在国外已是大规模测试研发的重要环节。在针对语言水平测试方面,国外已有众多相关研究(SauliTakala
关键词:河南省中考英语试卷;城乡生源;项目功能差异;公平性
一、 引言
任何一个大规模,高风险的考试的公平与否对考试研发机构,组织实施机构,所有的考试利益相关者,乃至整个社会都会有重要的影响。中招英语考试作为选拔性考试,事关考生的命运,事关政府部门的公信力,对整个社会都影响巨大。河南省每年中招考试参与人数都数以十万计,如此一項大规模,高风险测试,许多潜在的因素都可能会影响到测试的信度和效度,对考试公平性和有效性产生潜在影响,进而产生难以估量的社会效应。
项目功能差异(Differential Item Functioning,简称DIF)检验方法是常用的用来检验测试公平性的统计方法。DIF是指,对于某个特定项目,如果在来自同一目标特质的两批平行被试组中,显现出不同的统计特性,那么该项目就存在功能差异。(董圣鸿,马世晔,2001)“同一目标特质的两批平行被试组”是指在测验打算测查的能力(目标特质)上,两组被试具有相同的水平。在DIF的实际研究中,常会人为地把被试分为两组,分别称为参照组和目标组。
二、 文献综述
项目功能差异的检测在国外已是大规模测试研发的重要环节。在针对语言水平测试方面,国外已有众多相关研究(SauliTakala