论文部分内容阅读
【摘 要】本文对2013年高级英语期末考试各种答题数据进行了分析,同时根据答题情况剖析了目前考生的实际情况,找出了目前尚存在的不足之处,对今后如何提高高级英语信度和效度的问题进行了研究,提出了更仔细地研究考试大纲、完善考试内容等可以切实提高信度和效度的建议。
【关键词】测试;信度;效度;难易度;区分度
高级英语适用于已掌握英语基础知识的进入高年级的学生。实施期末考试的目的在于检查英语专业教学大纲的落实情况,对英语专业的高级英语教学质量进行全面、客观、公正的评估。
1. 高级英语期末测试的信度、效度总评
从2013年实施的高级英语测试数据的分析来看,整体情况不是很好,信度只达到了0.78,各大题中主要还存在区分度低、峰值低、难易度偏低的情况,因而导致整卷区分度低和偏易,致使信度未能达标。信度未达标的表面现象背后,存在着许多原因。首先看区分度方面的原因。高级英语期末考试都是上课老师自己命题,考虑仍有不周之处,各题的干扰项未能正确干扰,由于区分度合格的題量明显不足,就降低了整套题的总区分度。例如选择题中,序号为5的考题:
5. We shall always hope to find them supporting their own freedom,and to remember that in the past those who foolishly sought power by riding the back of the tiger ______inside.
A ended up B lost themselves C finished D accomplished
从A、B、C、D中选择一个正确答案,(A为正解),在260名考生中,215人选择了A,20人选择B,17人选C,8人选择D,经统计分析,答对率为0.82,属于较易的一类题型。小题的区分度为0.09, 大大低于0.30的区分度,包括正确答案在内的各项的区分度都不合格,且干扰项均为负值。整套题难度适中的题目偏少,造成了峰值为负,导致整套题难易适中的题目偏少的原因很多,但是题目偏易,多数题目来自课本的课后练习是主要的原因,它必然减少整套题中难度适中的题量。题目的难易度、考生成绩的分布、题目区分度与题目的信度的高低是相关的。
下面再看看效度的方面。效度分为内在效度和外在效度,在此只能做内在效度中的内容效度分析。什么是内容效度?内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样 。按此标准推算,我们的考试严格按照考试大纲命题,没有缩小,没有扩大,是有效的。
2. 提高信度和效度的策略和具体措施
2.1 提高信度的策略和具体措施
通过对2013年高级英语测试数据和对试题内容的分析,可以看出,信度较低的主要原因是尚存在区分考生水平的题目少于规定量和有些大题的难易度偏低。找出了提高信度的关键,就可以有针对性地作出改进。首先是对考试内容作出调整: ①适当减少语法题,好腾出空间增加语言能力测试题的比例。②减少低层次较易题数,增加能体现学生整体判断能力的高层次题目。其次是调整内容的深度和难度,加深内容可以提高难度,适当扩大高得分考生和低得分考生的距离,间接提高区分度。第三是提高每题干扰项的区分度。具体做法是:所有选择题不但在形式上、内容上要相似,而且又要有一定的差异;确保不出诡题,所有干扰项均须合理。我们认为,通过以上策略,基本上可以解决目前存在的问题和不足,提高测试题的区分度,使难易度呈正态分布,进而提高信度和效度。因为提高试题信度的关键要素就是整套试题要长,小题数多,标准差要大,还有区分能力强的题目必须多(桂诗春1986: 135;李筱菊1997: 128)。我们可以在考试内容和难度上作出一些调整、加深试题深度、酌情减少一般性的语言知识题、除提高干扰项的干扰度外,尚需调整考试试题类型,我们认为,通过以上策略,可以解决目前存在的问题和不足,提高测试题的区分度,使难易度呈正态分布,进而提高信度和效度。
2.2 提高效度的策略和具体措施
效度的提高主要体现在试题的适用范围,测试的内容能够反映考试大纲的要求,能具有一定的代表性,希望反映考生的真实水平。如果要做到这些,仅仅严格按照考试大纲来命题看来是不够的。另外,提高测试效度的不是统计手段,而是命题人员和审题人员的经验(桂诗春1986) 。这主要依靠试题的设计和命题时严格遵守考试大纲的要求,按考试大纲要求进行严格的覆盖分析(李筱菊1997) 。要群策群力,适当改变以往在小范围内进行命题的方式;此外,如果能组织老师每年都对考试结果利用统计学手段进行项目分析,分析效度、信度,以及每小题的区分度、试题难易度及整套试题的正态分布情况、考生成绩的分布情况等,以便将这些分析结果反馈到命题作业中去;起到促进和提高整个英语专业教学水平的作用;在这一系列研究的基础上,进行英语专业高级英语水平测试的题库建设。
参考文献:
[1]桂诗春. 标准化考试——理论、原则与方法[M ]. 广州:广东高等教育出版社,1986.
[2]李筱菊. 语言测试科学与艺术[M ]. 长沙:湖南教育出版社,1997.
[3]Shohamy E. The validity of direct versus semi-di-rect oral tests [J].Language Testing ,1994 ,(11) : 992124.
作者简介:
罗荻(1982-),女,四川自贡人,大学本科,讲师,四川理工学院外语学院专业外语教研室。
【关键词】测试;信度;效度;难易度;区分度
高级英语适用于已掌握英语基础知识的进入高年级的学生。实施期末考试的目的在于检查英语专业教学大纲的落实情况,对英语专业的高级英语教学质量进行全面、客观、公正的评估。
1. 高级英语期末测试的信度、效度总评
从2013年实施的高级英语测试数据的分析来看,整体情况不是很好,信度只达到了0.78,各大题中主要还存在区分度低、峰值低、难易度偏低的情况,因而导致整卷区分度低和偏易,致使信度未能达标。信度未达标的表面现象背后,存在着许多原因。首先看区分度方面的原因。高级英语期末考试都是上课老师自己命题,考虑仍有不周之处,各题的干扰项未能正确干扰,由于区分度合格的題量明显不足,就降低了整套题的总区分度。例如选择题中,序号为5的考题:
5. We shall always hope to find them supporting their own freedom,and to remember that in the past those who foolishly sought power by riding the back of the tiger ______inside.
A ended up B lost themselves C finished D accomplished
从A、B、C、D中选择一个正确答案,(A为正解),在260名考生中,215人选择了A,20人选择B,17人选C,8人选择D,经统计分析,答对率为0.82,属于较易的一类题型。小题的区分度为0.09, 大大低于0.30的区分度,包括正确答案在内的各项的区分度都不合格,且干扰项均为负值。整套题难度适中的题目偏少,造成了峰值为负,导致整套题难易适中的题目偏少的原因很多,但是题目偏易,多数题目来自课本的课后练习是主要的原因,它必然减少整套题中难度适中的题量。题目的难易度、考生成绩的分布、题目区分度与题目的信度的高低是相关的。
下面再看看效度的方面。效度分为内在效度和外在效度,在此只能做内在效度中的内容效度分析。什么是内容效度?内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样 。按此标准推算,我们的考试严格按照考试大纲命题,没有缩小,没有扩大,是有效的。
2. 提高信度和效度的策略和具体措施
2.1 提高信度的策略和具体措施
通过对2013年高级英语测试数据和对试题内容的分析,可以看出,信度较低的主要原因是尚存在区分考生水平的题目少于规定量和有些大题的难易度偏低。找出了提高信度的关键,就可以有针对性地作出改进。首先是对考试内容作出调整: ①适当减少语法题,好腾出空间增加语言能力测试题的比例。②减少低层次较易题数,增加能体现学生整体判断能力的高层次题目。其次是调整内容的深度和难度,加深内容可以提高难度,适当扩大高得分考生和低得分考生的距离,间接提高区分度。第三是提高每题干扰项的区分度。具体做法是:所有选择题不但在形式上、内容上要相似,而且又要有一定的差异;确保不出诡题,所有干扰项均须合理。我们认为,通过以上策略,基本上可以解决目前存在的问题和不足,提高测试题的区分度,使难易度呈正态分布,进而提高信度和效度。因为提高试题信度的关键要素就是整套试题要长,小题数多,标准差要大,还有区分能力强的题目必须多(桂诗春1986: 135;李筱菊1997: 128)。我们可以在考试内容和难度上作出一些调整、加深试题深度、酌情减少一般性的语言知识题、除提高干扰项的干扰度外,尚需调整考试试题类型,我们认为,通过以上策略,可以解决目前存在的问题和不足,提高测试题的区分度,使难易度呈正态分布,进而提高信度和效度。
2.2 提高效度的策略和具体措施
效度的提高主要体现在试题的适用范围,测试的内容能够反映考试大纲的要求,能具有一定的代表性,希望反映考生的真实水平。如果要做到这些,仅仅严格按照考试大纲来命题看来是不够的。另外,提高测试效度的不是统计手段,而是命题人员和审题人员的经验(桂诗春1986) 。这主要依靠试题的设计和命题时严格遵守考试大纲的要求,按考试大纲要求进行严格的覆盖分析(李筱菊1997) 。要群策群力,适当改变以往在小范围内进行命题的方式;此外,如果能组织老师每年都对考试结果利用统计学手段进行项目分析,分析效度、信度,以及每小题的区分度、试题难易度及整套试题的正态分布情况、考生成绩的分布情况等,以便将这些分析结果反馈到命题作业中去;起到促进和提高整个英语专业教学水平的作用;在这一系列研究的基础上,进行英语专业高级英语水平测试的题库建设。
参考文献:
[1]桂诗春. 标准化考试——理论、原则与方法[M ]. 广州:广东高等教育出版社,1986.
[2]李筱菊. 语言测试科学与艺术[M ]. 长沙:湖南教育出版社,1997.
[3]Shohamy E. The validity of direct versus semi-di-rect oral tests [J].Language Testing ,1994 ,(11) : 992124.
作者简介:
罗荻(1982-),女,四川自贡人,大学本科,讲师,四川理工学院外语学院专业外语教研室。