论文部分内容阅读
摘 要:随着我国科技的发展,计算机技术的提高。计算机自适应测试横空而出,它是融合了现代教育学的知识以及心理测量学的所有理论的一项综合测量考试。在计算机应用广泛的今天,人们开始关注计算机自适应测试。新的计算机自适应测试系统避免了在选题策略方面的不足性,避免了测试又安全,测试曝光指数较高,题库利用率低的一系列情况。下面我们就计算机测试系统在我国的应用,简单的概括总结一下。新的计算机自适应测试系统的应用必将带领我国在计算机 应用方面走向一个新的台阶。
关键词:计算机自适应系统;发展现状;系统安全
中图分类号:G623文献标识码: A
一、计算机自适应系统应用的需要
中国自古就以测试来挑选人才,高考中考更是以分数的划定来确定考核的对象。近年来,由于计算机的普及,考试阅卷过程中,已经实现了无纸化,中国考试由传统的集合优秀教师出题,研究生集体阅卷批改,人工统计正确率以及评测试卷分析等形式逐渐转变成计算机自行出题的形式。这种计算机出题的方法不但能节省大量的人力物力,还能提高试卷的出题效率,避免出现错题,漏题等情况。但是即使是先进的计算机出题,也存在着一定的弊端。
传统的CTT以没办法根据试题的难度系数来确定所占试卷比例大小,虽然试卷中大部分试题是由经验足够的专家预先设定好的。另外是在题库中容易出现同类型题目重复,对同知识点考察次数过多等情况。再次是没办法根据测试试题估定被测试者的能力的高低,没有一个准确定的把握。最后一条是传统的CTT题库维护比较困难,只是单纯的有个标题题目,没有题目考察的知识点,难点等等,对知识划分没有程度。所以随着我国教育事业发展突发猛进,在教育理论方面不断完善和丰富。在教育的实践过程中,不断的深入和应用。以往的CTT已经不能满足当今发展的需要。最新更新的计算机自适能力测试会自动根据个人能力,定制不同的考试试题。然后根据测试者的回答问题的情况,对测试者做大体估计,然后根据估计值,从题库中抽取合适题目让被测试者应对。题库中的题目都是经验丰富的老教师从众多当年考试的试卷中精选挑出的。计算机自适应系统在反复测评过程中,给被测评者的能力评定一个能力值,提高评测的精度,由此可以看出,新的计算机自适应系统有一下几个优点
1 评测过程较为灵活。由于被测试者需要回答的问题都是根据测试者的能力大小出的,所以被测试者完成整体试卷的时间大大缩短。同时被测试者不用因为题目过困难,出现粗心,疲惫,沮丧等情绪影响测量。整个过程中,被测试者能保持良好心态,降低被测试者考试过程中的疲惫程度。
2 测试结果精确度高。传统的CTT测试系统没办法根据题目困难程度划分题目在试卷中所占比例。其成绩精确程度相关性较低,也不能对学生能力进行较好区分。而现行的计算机自适应系统,会根据能力大小进行题目出题,不论被测者能力大小,均能有个准确值来评定。
3 自适应系统能够有效避免作弊情况的出现。由于自适应系统采用的是根据被测试者能力进行出题,所有题目均是随机抽取,提出题目出现相同率极低,出现在试卷上的顺序也不相同,这就有效避免了作弊情况的发生。
4 激发被测者的积极性。因为最新的自适应系统是根据被测试者能力来出题的,所以在整个过程中,能力低者也不会因为做不出题目来影响考试中的心情,保持自己良好的心态。同时题目对每个人来说又具有挑战性,不会让被测试者无从下手。
二、計算机自适应系统的发展现状
1 计算机自适应系统的发展过程 自适应系统的原型是二十世纪比内的智力测试。后来流传到英国,经过英国人改良,改名叫斯坦福-比内智力测试。这个测试过程基本为计算机自适应系统提供了蓝图。它是根据不同的年龄的被测试者,选定不同的题库(题库根据被测试者的年龄来设置经典题目)。被测试者完成一个题库后,就会被提供更高年龄段的题库来进行作答,整个过程就是一个人工的自算计自适应系统的演示,它有一个可变的入口点和一个难度可变的测试标准。比内测试基本就包含了计算机自适应系统的所有功能,不同区别在于一个是人工完成,一个是自算计自行处理。
2 比内测试并不是最完善的计算机自处理系统的样本,后来教育学家又经过不断的尝试,大量的研究,完善了比内测试的过程。美国的教学学家洛德进行灵活实验,就是根据测试者回答问题的状况,给测试者不同难度的问题,在根据回答问题的错误率,来确定被测试者的水平。
3 进入二十世纪,计算机革命后,计算机发展和应用给各行业均带来翻天覆地的变化,计算机智能系统的发明更是促使计算机自适应系统的发展更上一个台阶。美国科学家罗德根据自己之前提出的理论,包括比内测试的研究,首先提出了计算机自适应能力测试的相关概念。这一概念的提出,宣告了试卷考试的方式的终结,人们延续千年的用笔回答的问题的思维方式被打破。考试方式有了更多样的选择。更重要的是它通过一个更为人性话的测试来更准确的对被测试者的知识,能力,水平的测量,测试的题目也根据被测试者水平而确定。
4 随着计算机自测试系统的应用的进一步加强,CAT系统也在不断完善,计算机自测系统从单一的了解被测试者对题目的掌握能力到现在,不但具备上述功能,还根据被测试回答状况,进行下一步的选题。如果题目回答正确,则选择难度系数更大的问题,如果回答错误,则选择难度系数更小的问题。而且每一道题目具有被测试者的水平相差无几。这样子,能力较强的被测试者就不用做简单的试题而浪费时间,能力较弱的选手也不会因为作不出较难的题目而沮丧失去斗志。
因此,新型的计算机自适应系统解决了测试准确度以及跨越性的问题。为不同能力者提供合适的题目,并且根据测试结果提供精准信息。为我国教育事业的发展提供一个新的宏观角度,加大素质教育的可能。
三、计算机自适应系统在国内外使用的现状
1 在国外,军方首先使用计算机自适应系统进行挑选人才,在美国一九八四年的职业陆军选拔测试中就曾有运用。而在信息化发展狂潮中,美国的NOVEll也成功运用CAT进行竞赛选拔,使得当时的选拔人数一度突破1000000人次。现如今美国的教育,职业测评,以及人事管理方面都用到计算机自适应系统。在欧美的众多国家,CAT甚至成为教育测评,职业测评以及认证测评的主要方式。
2 在我国,计算机自适用系统引入较晚,致力于此方面的专家学者主要集中在全国大学英语四六级考试委员会。目前我国已经成功将计算机自适应系统用于GET的分数等值处理过程,试题库也跟着进一步加强完善。像我国06年举办的测试理论与技术发展趋势国际讨论会,就有中国教育部十多个部门的委员参加,中国对计算机自适用系统的引入决心可见一斑。中国的汉语水平测试,也已经运用了计算机自适应系统,现在出题更加合理化,人性化。
3 计算机自适应系统在高校发展中也略有成就,像我国大部分大专院校的计算机能力水平测试,均是根据被测者的能力,给不同考试试题的系统。除此之外,我国在IRT模型研究方面也发展迅速,TRT测试模式在台湾主要用于中小学教育,在我国虽然也同样用于教学中,但是我国的TRT还处于初步的发展阶段,想要普及到下面的乡村中学还需要一段艰辛的路要走。设计出一款性能以及操作性更好的测试方法,正是现阶段我们科研人员努力的方向。
四、计算机自适应系统选题策略研究
计算机自适应系统的主要作用就是通过对被测试者的能力的评估来不断的选定合适的题目供被测试者作答。而计算机自适应性系统中最重要的因素也就是CAT的选择过程。如何能够用最少量的题目来评测做题人的水平,是我们当今要加深研究的课题。不仅仅如此,我们还要保持题库的持续更新,对经常用不到的题目要加大相关连接,省的造成题库资源的浪费。下面几个办法是解决题库资源浪费严重的办法。我们可以逐一比较一下。
1 最大题目难度提取法 在原始题目分区的基础上,选择大部分题目的区分度为a,而较大难度的题目区分为b,只有当被测试者完成b难度系数,才会被提供难度较大的题目。
2 M-M随机抽样法 第一步是在当前的基础上,选择合适的题库,然后从题库中随机抽取难度较大的五个,选择其中之一让被测试者做,然后在从剩余的题目中随机抽取四个,选择其中之一测试,整体过程是逐渐递减的,一直到0为止,这样就能避免题库里的题目有些题目曝光率过大,而有些题目却一直没有利用上。
3 SH题目分离法 这个办法能降低在较高区题目的曝光次数,使得所有的题目都有被曝光的可能。它主要是利用将题目的选择过程以及题目管理过程区分开来,平衡题库中所有题目的曝光次数。
4 最相近准则法 这种方法是对随机抽样法以及题目分离法的一个综合运用。它基本是采用找到难度相近似的试题,然后根据被测试者能力选择信息量较大的难度试题。
总结
计算机自适应系统是科学发展与现实考试结合的产物,它立足于建立最佳测评方案,合理评估被测人能力,提高评审的准确度,并且通过测量结果选拔有用人才,此方法对发展中国家发展人才路线,有着积极深远的重要意义。
参考文献:
[1]张厚粲.教育测试新理论IRT研究和应用[J].外语教学与研究,2000-9(11).
[2]刘丽平,王文杰,郭世宁.计算机自适应考试系统题库的设计与实现[J].计算机系统应用,2006,18.
[3]林建,闰华,武兵.计算机自适应考试理论分析[J].太原理工大学学报,2004,35.
作者单位:吉林工商学院,长春 130000
关键词:计算机自适应系统;发展现状;系统安全
中图分类号:G623文献标识码: A
一、计算机自适应系统应用的需要
中国自古就以测试来挑选人才,高考中考更是以分数的划定来确定考核的对象。近年来,由于计算机的普及,考试阅卷过程中,已经实现了无纸化,中国考试由传统的集合优秀教师出题,研究生集体阅卷批改,人工统计正确率以及评测试卷分析等形式逐渐转变成计算机自行出题的形式。这种计算机出题的方法不但能节省大量的人力物力,还能提高试卷的出题效率,避免出现错题,漏题等情况。但是即使是先进的计算机出题,也存在着一定的弊端。
传统的CTT以没办法根据试题的难度系数来确定所占试卷比例大小,虽然试卷中大部分试题是由经验足够的专家预先设定好的。另外是在题库中容易出现同类型题目重复,对同知识点考察次数过多等情况。再次是没办法根据测试试题估定被测试者的能力的高低,没有一个准确定的把握。最后一条是传统的CTT题库维护比较困难,只是单纯的有个标题题目,没有题目考察的知识点,难点等等,对知识划分没有程度。所以随着我国教育事业发展突发猛进,在教育理论方面不断完善和丰富。在教育的实践过程中,不断的深入和应用。以往的CTT已经不能满足当今发展的需要。最新更新的计算机自适能力测试会自动根据个人能力,定制不同的考试试题。然后根据测试者的回答问题的情况,对测试者做大体估计,然后根据估计值,从题库中抽取合适题目让被测试者应对。题库中的题目都是经验丰富的老教师从众多当年考试的试卷中精选挑出的。计算机自适应系统在反复测评过程中,给被测评者的能力评定一个能力值,提高评测的精度,由此可以看出,新的计算机自适应系统有一下几个优点
1 评测过程较为灵活。由于被测试者需要回答的问题都是根据测试者的能力大小出的,所以被测试者完成整体试卷的时间大大缩短。同时被测试者不用因为题目过困难,出现粗心,疲惫,沮丧等情绪影响测量。整个过程中,被测试者能保持良好心态,降低被测试者考试过程中的疲惫程度。
2 测试结果精确度高。传统的CTT测试系统没办法根据题目困难程度划分题目在试卷中所占比例。其成绩精确程度相关性较低,也不能对学生能力进行较好区分。而现行的计算机自适应系统,会根据能力大小进行题目出题,不论被测者能力大小,均能有个准确值来评定。
3 自适应系统能够有效避免作弊情况的出现。由于自适应系统采用的是根据被测试者能力进行出题,所有题目均是随机抽取,提出题目出现相同率极低,出现在试卷上的顺序也不相同,这就有效避免了作弊情况的发生。
4 激发被测者的积极性。因为最新的自适应系统是根据被测试者能力来出题的,所以在整个过程中,能力低者也不会因为做不出题目来影响考试中的心情,保持自己良好的心态。同时题目对每个人来说又具有挑战性,不会让被测试者无从下手。
二、計算机自适应系统的发展现状
1 计算机自适应系统的发展过程 自适应系统的原型是二十世纪比内的智力测试。后来流传到英国,经过英国人改良,改名叫斯坦福-比内智力测试。这个测试过程基本为计算机自适应系统提供了蓝图。它是根据不同的年龄的被测试者,选定不同的题库(题库根据被测试者的年龄来设置经典题目)。被测试者完成一个题库后,就会被提供更高年龄段的题库来进行作答,整个过程就是一个人工的自算计自适应系统的演示,它有一个可变的入口点和一个难度可变的测试标准。比内测试基本就包含了计算机自适应系统的所有功能,不同区别在于一个是人工完成,一个是自算计自行处理。
2 比内测试并不是最完善的计算机自处理系统的样本,后来教育学家又经过不断的尝试,大量的研究,完善了比内测试的过程。美国的教学学家洛德进行灵活实验,就是根据测试者回答问题的状况,给测试者不同难度的问题,在根据回答问题的错误率,来确定被测试者的水平。
3 进入二十世纪,计算机革命后,计算机发展和应用给各行业均带来翻天覆地的变化,计算机智能系统的发明更是促使计算机自适应系统的发展更上一个台阶。美国科学家罗德根据自己之前提出的理论,包括比内测试的研究,首先提出了计算机自适应能力测试的相关概念。这一概念的提出,宣告了试卷考试的方式的终结,人们延续千年的用笔回答的问题的思维方式被打破。考试方式有了更多样的选择。更重要的是它通过一个更为人性话的测试来更准确的对被测试者的知识,能力,水平的测量,测试的题目也根据被测试者水平而确定。
4 随着计算机自测试系统的应用的进一步加强,CAT系统也在不断完善,计算机自测系统从单一的了解被测试者对题目的掌握能力到现在,不但具备上述功能,还根据被测试回答状况,进行下一步的选题。如果题目回答正确,则选择难度系数更大的问题,如果回答错误,则选择难度系数更小的问题。而且每一道题目具有被测试者的水平相差无几。这样子,能力较强的被测试者就不用做简单的试题而浪费时间,能力较弱的选手也不会因为作不出较难的题目而沮丧失去斗志。
因此,新型的计算机自适应系统解决了测试准确度以及跨越性的问题。为不同能力者提供合适的题目,并且根据测试结果提供精准信息。为我国教育事业的发展提供一个新的宏观角度,加大素质教育的可能。
三、计算机自适应系统在国内外使用的现状
1 在国外,军方首先使用计算机自适应系统进行挑选人才,在美国一九八四年的职业陆军选拔测试中就曾有运用。而在信息化发展狂潮中,美国的NOVEll也成功运用CAT进行竞赛选拔,使得当时的选拔人数一度突破1000000人次。现如今美国的教育,职业测评,以及人事管理方面都用到计算机自适应系统。在欧美的众多国家,CAT甚至成为教育测评,职业测评以及认证测评的主要方式。
2 在我国,计算机自适用系统引入较晚,致力于此方面的专家学者主要集中在全国大学英语四六级考试委员会。目前我国已经成功将计算机自适应系统用于GET的分数等值处理过程,试题库也跟着进一步加强完善。像我国06年举办的测试理论与技术发展趋势国际讨论会,就有中国教育部十多个部门的委员参加,中国对计算机自适用系统的引入决心可见一斑。中国的汉语水平测试,也已经运用了计算机自适应系统,现在出题更加合理化,人性化。
3 计算机自适应系统在高校发展中也略有成就,像我国大部分大专院校的计算机能力水平测试,均是根据被测者的能力,给不同考试试题的系统。除此之外,我国在IRT模型研究方面也发展迅速,TRT测试模式在台湾主要用于中小学教育,在我国虽然也同样用于教学中,但是我国的TRT还处于初步的发展阶段,想要普及到下面的乡村中学还需要一段艰辛的路要走。设计出一款性能以及操作性更好的测试方法,正是现阶段我们科研人员努力的方向。
四、计算机自适应系统选题策略研究
计算机自适应系统的主要作用就是通过对被测试者的能力的评估来不断的选定合适的题目供被测试者作答。而计算机自适应性系统中最重要的因素也就是CAT的选择过程。如何能够用最少量的题目来评测做题人的水平,是我们当今要加深研究的课题。不仅仅如此,我们还要保持题库的持续更新,对经常用不到的题目要加大相关连接,省的造成题库资源的浪费。下面几个办法是解决题库资源浪费严重的办法。我们可以逐一比较一下。
1 最大题目难度提取法 在原始题目分区的基础上,选择大部分题目的区分度为a,而较大难度的题目区分为b,只有当被测试者完成b难度系数,才会被提供难度较大的题目。
2 M-M随机抽样法 第一步是在当前的基础上,选择合适的题库,然后从题库中随机抽取难度较大的五个,选择其中之一让被测试者做,然后在从剩余的题目中随机抽取四个,选择其中之一测试,整体过程是逐渐递减的,一直到0为止,这样就能避免题库里的题目有些题目曝光率过大,而有些题目却一直没有利用上。
3 SH题目分离法 这个办法能降低在较高区题目的曝光次数,使得所有的题目都有被曝光的可能。它主要是利用将题目的选择过程以及题目管理过程区分开来,平衡题库中所有题目的曝光次数。
4 最相近准则法 这种方法是对随机抽样法以及题目分离法的一个综合运用。它基本是采用找到难度相近似的试题,然后根据被测试者能力选择信息量较大的难度试题。
总结
计算机自适应系统是科学发展与现实考试结合的产物,它立足于建立最佳测评方案,合理评估被测人能力,提高评审的准确度,并且通过测量结果选拔有用人才,此方法对发展中国家发展人才路线,有着积极深远的重要意义。
参考文献:
[1]张厚粲.教育测试新理论IRT研究和应用[J].外语教学与研究,2000-9(11).
[2]刘丽平,王文杰,郭世宁.计算机自适应考试系统题库的设计与实现[J].计算机系统应用,2006,18.
[3]林建,闰华,武兵.计算机自适应考试理论分析[J].太原理工大学学报,2004,35.
作者单位:吉林工商学院,长春 130000