论文部分内容阅读
语言是人类特有的,有着很多独特的特点。而口语更具有“瞬间性、临时性、短暂性”(Fulcher,2003)以及易变、不稳定等显著特点。因此,口语能力的测试,和其它外语能力的测试相比,是一种主观性的语言测试,更加难以把握。如果考生的数量达到成千上万的话,口语的标准化测试更是难上加难。
一、测试理论的发展
纵观外语测试史,外语测试经历了三种不同的测试体系:科学前测试体系(Pre-seientific Period)、结构主义测试体系(The Period ofStructural Linguistics)和交际测试体系(Communicativeive TestingPedod)(李筱菊,1997:6-8)。虽然外语测试的历史有上百年,但直到20世纪40年代以后,结构主义测试体系兴起,口语测试才成为语言能力评估的一部分。20世纪80年代,口语测试进入交际法语言测试时期。交际性测试理论对语言测试模式产生了巨大而深远的影响。
现今交际性口语测试逐渐成为语言测试的一个热点,引起国内外学者的广泛关注,许多语言学家、测试专家正努力解决一些长期困扰他们的交际口语测试问题,如为什么要测试、如何测试、测试什么内容、测试对象等。其中,国外做出大量研究的学者有Robert Wood,J.Charles Alderson,Caroline Clapham,Di-anne Wall等许多学者,国内有李筱菊,邹申,文秋芳等学者对口语测试也做出了大量的研究。现在许多口语考试就是以交际能力理论为基础设计的,其目的就是为了能够尽可能准确地检查考生的语言交际能力。在我国推行的英国剑桥大学商务英语证书(Business English Certi-ficate)考试就是依据这一模式设计的(韩宝成,1995:55)。
二、课程改革的需要
中学英语的教学任务是通过对学生听、说、读、写的训练,使学生掌握一定的语言基本知识和基本技能,并初步具有运用英语进行交际的能力,英语口语是中学英语教学的重要内容之一,英语口语测试也越来越受到重视。
教育部《英语课程标准(实验稿)》(2001:14)对语言技能目标作了分级描述,初中毕业应达五级目标,其中对说的要求是:1 能就简单的话题提供信息,表达简单的观点和意见,参与讨论;2 能与他人沟通信息,合作完成任务;3 能在口头表达中进行适当的自我修正;4 能有效地询问信息和请求帮助;5 能根据话题进行情景对话;6 能用英语表演短剧;7 在以上口语活动中语音、语调自然,语气恰当。在教学评价方面,《英语课程标准(实验稿)》(2001:37-38)指出:“终结性评价必须以考查学生综合语言运用能力为目标,力争科学地、全面地考查学生在经过一段学习后所具有的语言水平。测试应该包括口试、听力考试和笔试等形式,全面考查学生综合语言运用能力。”《英语课程标准(实验稿)》(2001)明确指出考试形式既要有听力测试和笔试,又要有口语测试。
江苏省自2000年开始在全省范围内推行中学生英语口语等级测试制度,着重考查学生的口头表达能力,经过试点与推广,现已在全省普及。2003年起,苏州市将英语口语等级测试成绩计入中考总分,更是体现了口试的重要性。各级学校普遍重视了英语口语的训练与提高,苏州市的部分初中在七、八年级的英语考试中也相应地增设了口试内容。
通过英语口语测试,教师可以检查学生学习英语的情况,以及运用英语进行交际的能力,加深对学生的了解,从中发现问题,改进教学,提高教学效果;学生参与英语口试,可以使他们感受到学习成功的喜悦,激发他们积极参与课堂的学习和课外活动,树立起能学好英语的自信心,敢于大胆开口说英语。
三、口试的评分方法
口语测试的评分是评分员采用某一特定评分方法,根据已经确定的评分标准和评分规则,参考口语水平量表对口语测试的表现或言语样本等级所做的描述,对被试的口语水平作出主观判断并赋值的过程。
徐强(1992)认为科学的评分标准主要指评分方式的科学性,与写作评分一样,口语测试的评分方法根据评分方式通常有两种:综合法和分析法(文秋芳,1999:79)。综合法是测试员从总体上把握考生的口试表现,凭测试员对考生的总体印象打分,速度相对较快。这种方法能够从整体上考虑被试的口语能力,具有较高的效度。
分析法是把口试表现分解为若干要点,如语法、内容、语音语调、流利程度、准确度和词汇的使用等。不同的要点可作不同的加权处理,各要点得分总和为口试的总成绩,速度相对慢一些,但评分结果要相对准确一点,评分细化,要比整体评分法更客观,信度较高,分析法侧重于语言结构和语法规则的正确性,综合法则强调语言的交际功能和交际效果。
目前的初中英语口语测试中,一般采用了综合法与分析法相结合的方法来评分,这样一来,既可以保持总体印象,也不忽视口语能力中的各个要素,为了减少评分的误差,口试通常采用双人评分或者多人评分,就是两人或者两人以上分别为同一名学生评分,得分取评分人给的分数的平均分。如果教师有较高的水平,能够掌握评分标准,而且搭配适当,可以明显提高评分质量。很多大规模的标准化考试都采用两种方法结合的方法来给被试评分,如剑桥大学考试委员会ESOL考试部的口语测试。
四、口试评分中的问题
过去“许多教师和测试专家都承认,口语测试评分很难做到客观公正,根本原因是其中要注意的成分太多,而且无法进行定量分析”(刘润清,1991:198)。Heaton(1988)认为口语测试对教学产生积极的反拨作用,有利于促进教学,促进学生口语能力的提高,应该尽可能坚持。但是,他也认为口语测试可能没有信度(信度低)。
上述观点主要认为现行的直接性口语测试能够有效地测试、评估学生运用英语进行口头表达的能力,效度较高;但口语测试评分主观性强,信度难以得到有效保证,如何保证口语测试的信度,一直是摆在口语测试人员面前的一道难题;口试评分的误差问题一直是语言测试研究领域的重点和难点。
在苏州市初中英语口语测试的过程中,每年考前一周由英语教研室临时在各校抽调一部分英语教师进行培训,作为口试考官仓促上岗。口试考官每年都不固定,部分新教师经验不足,很难保证稳定的高质量的口试教师队伍,确保评分者状态良好。口试教师往往连续工作三天,既当测试员,又当评分员,承受极大的心理压力,往往出现评分前紧后松、忽高忽低、时宽时严的现象,或者为避免矛盾而人为降低评分标准出现。口试主 考、副主考职责不够明确,口试进行时,考官只是忙于为独立的个体打分,缺少两个考官之间对分数把握的比较,尺度不一样,考生的成绩缺乏可比性,信度较低,所定分值很难客观,使口试让人觉得不那么正规,此外,口试考场缺少录音或录像设备,对口试教师缺少有效监督,口试资料也无法保存。根据规定,口试成绩要一个月以后公布,如果这时考生对评分有异议时,口试已经结束,无法对考生当时的表现进行重新评估和核实。
五、严格筛选和培训考官
要提高口试考官的评分信度,措施之一就是规范考前口试考官的培训。“提高口试信度最科学的方法就是严格筛选和培训考官”(黄素华。1998:102)。
第一,需要培养一支有一定规模的固定考官队伍。考官的业务水平和思想素质对考试起到关键的作用,评分者是决定被测试者的测试结果的重要因素。评分这一过程是确保测试可靠性的最后一步,也是至关重要的一步。因此,可以对口试考官进行专业培训并考核,并发放考官证书。大规模正规的口语测试的考官应由主管口试工作的教育部门经过培训考核并发给考官证书,可模仿普通话水平测试考核资格证书测试,考官资格测试是一种口语测试,全部测试内容应该均以口头方式进行。这种测试不是口才的评定,而是对应试人掌握和运用英语口语所达到的规范程度的测查和评定,考官一旦获得测试证书则取得考核资格,则相对稳定。
第二,对口试纲要和评分标准的学习仍然必不可少,这是进行考官培训的基本步骤。
第三,规范考前考官培训,在正式考试前,每次都要播放对不同类型的中学生进行模拟考试的拍摄录像或录音,并且录像或录音应该供考官考前培训使用。口试主考无论把口试的要求、步骤和注意事项记得多牢,口试的评分人员无论把评分标准的各项规定背得多熟,他们掌握的都只是概念上的东西,是抽象的知识。不经过预先的演练,口试教师无法检验自己的理解是否正确、无法体会实际操作的感觉、无法了解自己的实践与要求之间的差距,通过模拟口试的录像或录音,对口试进行观摩或倾听后评分,体会口试的主考过程和评分的掌握尺度,了解口试操作的不同和对评分尺度掌握上的差异,口试模拟中,所有的考官先各自打分,然后集体讨论各自打分的理由,为什么把握的尺度紧了或者松了等,以寻求达到一致的可能性。通过考前培训,做到不同考场的口试考官和同一考场的主考与评分人员都严格按照评分标准打分,评分有一致性。
第四,设立口试考官的筛选淘汰机制,口试考官资格不可一劳永逸。无论其经验多么丰富,业务水平多高,每次口试前都必须进行短期培训,确保口试评分的信度。并且,应该通过口语考试中的突击抽查和考试后的意见反馈,淘汰不合格的口试考官,建立口试评分的质量监控体系。
六、总结
总的来说,江苏省初中生英语口语等级测试的考官评分方法是比较科学的,但还存在一些口试评分常见的问题,有一些可改进的地方。为了使测试结果更加公平、公正,提高口试对外语教学的反拨作用,有必要提高初中英语口试中考官评分的信度,以此不断改进苏州市初三学生英语口语等级测试,科学公正地评价初中学生的英语水平,以促进口语测试及中小学英语教学健康发展,推动课程改革顺利实施。
如果说以前的口语测试考官评分是靠主观经验,那么今后的考官评分一定是采用科学、客观、有效的评分准则(杨莉芳,2006),目前缺乏的是一个完整的理论模型来解释考生、主考官、测试形式、测试任务、评分准则、评分环境等各种因素与评分员、评分行为之间的相互作用关系(Upshur&Turner,1999),这也是今后英语口语测试评分研究的首要课题。
一、测试理论的发展
纵观外语测试史,外语测试经历了三种不同的测试体系:科学前测试体系(Pre-seientific Period)、结构主义测试体系(The Period ofStructural Linguistics)和交际测试体系(Communicativeive TestingPedod)(李筱菊,1997:6-8)。虽然外语测试的历史有上百年,但直到20世纪40年代以后,结构主义测试体系兴起,口语测试才成为语言能力评估的一部分。20世纪80年代,口语测试进入交际法语言测试时期。交际性测试理论对语言测试模式产生了巨大而深远的影响。
现今交际性口语测试逐渐成为语言测试的一个热点,引起国内外学者的广泛关注,许多语言学家、测试专家正努力解决一些长期困扰他们的交际口语测试问题,如为什么要测试、如何测试、测试什么内容、测试对象等。其中,国外做出大量研究的学者有Robert Wood,J.Charles Alderson,Caroline Clapham,Di-anne Wall等许多学者,国内有李筱菊,邹申,文秋芳等学者对口语测试也做出了大量的研究。现在许多口语考试就是以交际能力理论为基础设计的,其目的就是为了能够尽可能准确地检查考生的语言交际能力。在我国推行的英国剑桥大学商务英语证书(Business English Certi-ficate)考试就是依据这一模式设计的(韩宝成,1995:55)。
二、课程改革的需要
中学英语的教学任务是通过对学生听、说、读、写的训练,使学生掌握一定的语言基本知识和基本技能,并初步具有运用英语进行交际的能力,英语口语是中学英语教学的重要内容之一,英语口语测试也越来越受到重视。
教育部《英语课程标准(实验稿)》(2001:14)对语言技能目标作了分级描述,初中毕业应达五级目标,其中对说的要求是:1 能就简单的话题提供信息,表达简单的观点和意见,参与讨论;2 能与他人沟通信息,合作完成任务;3 能在口头表达中进行适当的自我修正;4 能有效地询问信息和请求帮助;5 能根据话题进行情景对话;6 能用英语表演短剧;7 在以上口语活动中语音、语调自然,语气恰当。在教学评价方面,《英语课程标准(实验稿)》(2001:37-38)指出:“终结性评价必须以考查学生综合语言运用能力为目标,力争科学地、全面地考查学生在经过一段学习后所具有的语言水平。测试应该包括口试、听力考试和笔试等形式,全面考查学生综合语言运用能力。”《英语课程标准(实验稿)》(2001)明确指出考试形式既要有听力测试和笔试,又要有口语测试。
江苏省自2000年开始在全省范围内推行中学生英语口语等级测试制度,着重考查学生的口头表达能力,经过试点与推广,现已在全省普及。2003年起,苏州市将英语口语等级测试成绩计入中考总分,更是体现了口试的重要性。各级学校普遍重视了英语口语的训练与提高,苏州市的部分初中在七、八年级的英语考试中也相应地增设了口试内容。
通过英语口语测试,教师可以检查学生学习英语的情况,以及运用英语进行交际的能力,加深对学生的了解,从中发现问题,改进教学,提高教学效果;学生参与英语口试,可以使他们感受到学习成功的喜悦,激发他们积极参与课堂的学习和课外活动,树立起能学好英语的自信心,敢于大胆开口说英语。
三、口试的评分方法
口语测试的评分是评分员采用某一特定评分方法,根据已经确定的评分标准和评分规则,参考口语水平量表对口语测试的表现或言语样本等级所做的描述,对被试的口语水平作出主观判断并赋值的过程。
徐强(1992)认为科学的评分标准主要指评分方式的科学性,与写作评分一样,口语测试的评分方法根据评分方式通常有两种:综合法和分析法(文秋芳,1999:79)。综合法是测试员从总体上把握考生的口试表现,凭测试员对考生的总体印象打分,速度相对较快。这种方法能够从整体上考虑被试的口语能力,具有较高的效度。
分析法是把口试表现分解为若干要点,如语法、内容、语音语调、流利程度、准确度和词汇的使用等。不同的要点可作不同的加权处理,各要点得分总和为口试的总成绩,速度相对慢一些,但评分结果要相对准确一点,评分细化,要比整体评分法更客观,信度较高,分析法侧重于语言结构和语法规则的正确性,综合法则强调语言的交际功能和交际效果。
目前的初中英语口语测试中,一般采用了综合法与分析法相结合的方法来评分,这样一来,既可以保持总体印象,也不忽视口语能力中的各个要素,为了减少评分的误差,口试通常采用双人评分或者多人评分,就是两人或者两人以上分别为同一名学生评分,得分取评分人给的分数的平均分。如果教师有较高的水平,能够掌握评分标准,而且搭配适当,可以明显提高评分质量。很多大规模的标准化考试都采用两种方法结合的方法来给被试评分,如剑桥大学考试委员会ESOL考试部的口语测试。
四、口试评分中的问题
过去“许多教师和测试专家都承认,口语测试评分很难做到客观公正,根本原因是其中要注意的成分太多,而且无法进行定量分析”(刘润清,1991:198)。Heaton(1988)认为口语测试对教学产生积极的反拨作用,有利于促进教学,促进学生口语能力的提高,应该尽可能坚持。但是,他也认为口语测试可能没有信度(信度低)。
上述观点主要认为现行的直接性口语测试能够有效地测试、评估学生运用英语进行口头表达的能力,效度较高;但口语测试评分主观性强,信度难以得到有效保证,如何保证口语测试的信度,一直是摆在口语测试人员面前的一道难题;口试评分的误差问题一直是语言测试研究领域的重点和难点。
在苏州市初中英语口语测试的过程中,每年考前一周由英语教研室临时在各校抽调一部分英语教师进行培训,作为口试考官仓促上岗。口试考官每年都不固定,部分新教师经验不足,很难保证稳定的高质量的口试教师队伍,确保评分者状态良好。口试教师往往连续工作三天,既当测试员,又当评分员,承受极大的心理压力,往往出现评分前紧后松、忽高忽低、时宽时严的现象,或者为避免矛盾而人为降低评分标准出现。口试主 考、副主考职责不够明确,口试进行时,考官只是忙于为独立的个体打分,缺少两个考官之间对分数把握的比较,尺度不一样,考生的成绩缺乏可比性,信度较低,所定分值很难客观,使口试让人觉得不那么正规,此外,口试考场缺少录音或录像设备,对口试教师缺少有效监督,口试资料也无法保存。根据规定,口试成绩要一个月以后公布,如果这时考生对评分有异议时,口试已经结束,无法对考生当时的表现进行重新评估和核实。
五、严格筛选和培训考官
要提高口试考官的评分信度,措施之一就是规范考前口试考官的培训。“提高口试信度最科学的方法就是严格筛选和培训考官”(黄素华。1998:102)。
第一,需要培养一支有一定规模的固定考官队伍。考官的业务水平和思想素质对考试起到关键的作用,评分者是决定被测试者的测试结果的重要因素。评分这一过程是确保测试可靠性的最后一步,也是至关重要的一步。因此,可以对口试考官进行专业培训并考核,并发放考官证书。大规模正规的口语测试的考官应由主管口试工作的教育部门经过培训考核并发给考官证书,可模仿普通话水平测试考核资格证书测试,考官资格测试是一种口语测试,全部测试内容应该均以口头方式进行。这种测试不是口才的评定,而是对应试人掌握和运用英语口语所达到的规范程度的测查和评定,考官一旦获得测试证书则取得考核资格,则相对稳定。
第二,对口试纲要和评分标准的学习仍然必不可少,这是进行考官培训的基本步骤。
第三,规范考前考官培训,在正式考试前,每次都要播放对不同类型的中学生进行模拟考试的拍摄录像或录音,并且录像或录音应该供考官考前培训使用。口试主考无论把口试的要求、步骤和注意事项记得多牢,口试的评分人员无论把评分标准的各项规定背得多熟,他们掌握的都只是概念上的东西,是抽象的知识。不经过预先的演练,口试教师无法检验自己的理解是否正确、无法体会实际操作的感觉、无法了解自己的实践与要求之间的差距,通过模拟口试的录像或录音,对口试进行观摩或倾听后评分,体会口试的主考过程和评分的掌握尺度,了解口试操作的不同和对评分尺度掌握上的差异,口试模拟中,所有的考官先各自打分,然后集体讨论各自打分的理由,为什么把握的尺度紧了或者松了等,以寻求达到一致的可能性。通过考前培训,做到不同考场的口试考官和同一考场的主考与评分人员都严格按照评分标准打分,评分有一致性。
第四,设立口试考官的筛选淘汰机制,口试考官资格不可一劳永逸。无论其经验多么丰富,业务水平多高,每次口试前都必须进行短期培训,确保口试评分的信度。并且,应该通过口语考试中的突击抽查和考试后的意见反馈,淘汰不合格的口试考官,建立口试评分的质量监控体系。
六、总结
总的来说,江苏省初中生英语口语等级测试的考官评分方法是比较科学的,但还存在一些口试评分常见的问题,有一些可改进的地方。为了使测试结果更加公平、公正,提高口试对外语教学的反拨作用,有必要提高初中英语口试中考官评分的信度,以此不断改进苏州市初三学生英语口语等级测试,科学公正地评价初中学生的英语水平,以促进口语测试及中小学英语教学健康发展,推动课程改革顺利实施。
如果说以前的口语测试考官评分是靠主观经验,那么今后的考官评分一定是采用科学、客观、有效的评分准则(杨莉芳,2006),目前缺乏的是一个完整的理论模型来解释考生、主考官、测试形式、测试任务、评分准则、评分环境等各种因素与评分员、评分行为之间的相互作用关系(Upshur&Turner,1999),这也是今后英语口语测试评分研究的首要课题。