论文部分内容阅读
传统的纸笔测验(Paper and Pencil Test, PPT)对于所有被试施测的是同样的试题,是“千人一卷”的测验,但是由于不同被试的能力水平差异较大,为了使试卷能够测出占总体大多数的中等被试的水平,因此,纸笔测验中的题目以中等难度的题目为主,而容易题和较难题只占很少的一部分,这样一来,可能比较适合中等水平的被试;对于水平较低的被试来说,即使中等难度的题对于他们来说还是太难,因此,水平较低的被试只能做出试卷中的很少一部分题目,这样的试卷对于水平较低的被试来说不太适合,因为太多的题目不会做而容易产生受挫的心理,进而无法测出实际的水平;同样,对于高水平的被试来说,中等难度的项目对于他们来说,可能也过于容易,这样的试卷对于他们来说也不太适合,因为他们做了太多“容易”的题,可能会导致厌烦的心理而无法测出实际的能力水平。
目前的考试系统多是基于计算机的考试系统,即利用计算机这个先进的工具来替代人工进行选题,评分及统计工作,但是在操作过程中,计算机只是简单的起到一个“计算工具”,“显示工具”的作用,没有真正发挥计算机的智能,这类考试系统因此被称为基于计算机的考试系统(Computer Based Test, CBT)。
计算机自适应测验(Computerized Adaptive Test, CAT)是随着计算机技术、现代教育测量理论-项目反应理论(Item Response Theory, IRT)的发展而兴起的一种新的测验方式。在CAT中,计算机不再只是测验的“执行者”,而是测验的“决策者”,计算机能根据被试的能力水平不同,呈现不同的题目,能够做到“因材施测”。计算机自适应测验目前在我国的应用还不广泛,这里边的原因有多方面的,首先由于纸笔测验形式在我国已流行千年,人们已经习惯了纸笔测验的考试形式;其次是现代教育测量理论-项目反应理论的研究在我国的研究学者较少,起步也比较晚,不过近几年发展势头比较好;第三,与教育部门对于自适应测验方面的支持力度不大,重视程度不够也有很大的关系。近几年来,计算机自适应测验在我国的发展很快,出现了一大批研究项目反应理论的专家和学者,也取得了很多的成果,本文正是在这样的背景下,将自适应测验应用到实际的测验中,通过与传统的基于计算机的测验相比,实验结果表明,自适应测验符合现代教育测量的发展趋势,基本上解决了传统的基于计算机的测验中无法解决的问题。随着计算机技术、项目反应理论的进一步发展,计算机自适应测验在我国必将获得更加广泛的发展空间。