论文部分内容阅读
计算机适应性序列测试是在计算机适应性测试的基础上发展出来的一种多阶段、以模块为单位进行适应性测试的设计框架。随着语言测试计算机化的趋势日益显著,根据全国英语等级考试的特点,结合计算机适应性序列测试的优势,研究者提出并设计了英语计算机适应性序列测试。 为了检验英语采用计算机适应性序列测试设计的性能,在模拟研究一中,研究者模拟了样本量分别为500、1000、3000、5000四个不同数量的考生群体作答1-3-5三阶段适应性序列测试框架和1-2-5-5四阶段适应性序列测试框架的情况,并比较了两种测试设计各项评价指标,从宏观角度初步确定全国英语等级考试以1-2-5.-5四阶段测试设计更为合理准确。在模拟研究二中,研究者以样本量1000为例,对1-2-5-5测试框架重复模拟了30次,从微观角度检验了每条路径的测试效果,并比较了程序嵌入的自编能力估计程序与商业软件Conquest对考生能力估计的一致性,结果表明,英语计算机适应性序列测试所设计的路径能够满足不同能力水平考生的要求,一次测试能够对考生英语水平所达到的级别(五个级别)进行准确的判断,而且各条路径的测量精度均能够达到适应性考试的要求。自编的能力估计程序准确、可靠。 在实证研究一中,根据全国英语等级考试的考生群体分布,选取高二学生423人和大学英语系学生341人参加该英语计算机适应性序列测试,同时使用问卷调查被试对该测试的感受。结果表明,从测量标准误来看,该测试的信度非常好,能够对被试的英语水平进行比较准确的测量;但被试对计算机测试形式不够适应,与纸笔测试形式的感受不同,计算机测试模式有可能影响测试成绩。在实证研究二中,以全国英语等级考试五级为例,选取出国培训班学生404人为被试,研究了纸笔测试和计算机测试两种测试模式下各部分测试成绩的可比性,同时探讨了测试的结构效度。结果表明,被试参加计算机测试的成绩低于纸笔测试的成绩,具体体现在听力和阅读理解上存在测试模式效应,而在完形填空上两种测试模式没有明显差异。纸笔测试和计算机测试两种测试模式基本具有同样的结构效度。 本研究证实了英语采用计算机适应性序列测试的可行性,在进一步完善的基础上,我国大规模英语测试有望推出计算机适应性序列测试。