中国英语考试行为准则制订:一项探索性研究

被引量 : 2次 | 上传用户:magic1136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年以来,世界各地的语言测试组织和机构纷纷制订了自己的语言测试标准或者测试行为准则,以期提高语言测试的质量和专业化水平(参见如AERA/APA/NCME, 1999; ALTE, 1994; EALTA, 2006; ETS, 2002; ILTA, 2000, 2007; JLTA, 2003等)。与此同时,随着我国国际交往的日益频繁,学习英语人数的不断攀升,英语考试在我国得到了迅猛的发展。这些英语考试往往都是大规模、标准化、高风险的考试。而且,这些考试对英语的教学往往容易产生重要的反拨作用,在社会上具有广泛的影响。因此这些考试本身的质量如何,考试是否能够公平、有效地测量出考生的英语水平,成为引人关注的问题。本研究的目的是为我国英语考试的开发、实施和使用制订一套适合我国国情和考试特点的《良好测试行为准则》(下简称为《准则》)。世界上很多测试标准或准则的开发与起草,往往取决于开发或者起草人员对于考试特征的主观性或者经验性的认识与了解。本研究与这些测试标准制订的不同之处在于其采用了以数据为基础的途径,也就是说标准的框架和条款主要取决于在本研究各个阶段所收集的数据。为了达到制订《准则》的目的,本研究拟回答以下三个研究问题:1)目前世界各地已经制订、实施和使用的语言测试标准有哪些?这些标准的制订,对于我们开发适合我国国情和考试特点的标准,有哪些启发?2)我们所要制订和实施的《准则》,其外在的环境特征是什么?3)《准则》的框架和条款分别是什么?如何将我们所采集的数据应用到《准则》的框架和条款的制订中?为了回答这三个研究问题,本研究采取了三个阶段的设计方案。在第一阶段,我们收集并且系统回顾了语言测试领域的主要标准。这些标准由世界各地的语言测试组织与机构制订,并且这些标准的颁布实施对于语言测试领域都具有一定的影响。我们回顾的这些标准中,包括了国际语言测试协会的《道德准则》(ILTA, 2000),美国教育研究协会、美国心理协会和美国国家教育测量协会三家机构共同颁布的《教育与心理测量标准》(AERA/APA/NCME, 1999)以及美国教育考试中心所制订颁布的《ETS质量与公平标准》(ETS, 2002)。通过对这些标准全面、细致、系统的回顾,我们建立了制订语言测试标准的基本模型。在这一模型中,我们明确了制订标准的步骤及核心要素。这一模型将被运用到《准则》的制订中。在第二阶段,我们对目前我国英语考试在开发、实施和使用的各个阶段的具体做法进行了详细的调查研究。全国共有六家考试机构、490名高校学生和166名高校教师参加了本项调查。本调查分为两个阶段:第一阶段是调查考试机构在考试开发、实施和使用全过程中的具体做法;第二阶段是了解学生与教师对于考试开发、实施和使用各个方面的评价。调查采用了定性和定量相结合的研究方法,主要的研究工具为三份调查问卷。同时,调查中也使用了三份清单和一份访谈纲要。通过对考试机构的调查,我们了解了目前考试机构在考试各个阶段的做法,确定了在考试开发、实施和使用各个环节的长处和亟待改进的地方。通过调查发现,考试机构在考试全过程中都采用了自己机构内部制订的质量控制措施,但是这些措施本身的效度有待进一步证明;试测、考试信息的透明度、以及报道和使用考试成绩等方面存在的问题较多,从而影响到考试的效度和公平性。对于学生和教师的问卷调查进一步确认了第一阶段的调查结果。我们发现,学生和教师总体上对英语考试的看法较为积极。学生和教师认为,英语考试存在的不足之处包括有些考试的任务设计不太真实、选择题过多、考试实施中作弊现象严重、考试的评分不够精确以及口语能力的考察不足等。对考试机构和考生及教师的实证性调查让我们进一步意识到为我国英语考试制订《准则》的必要性和急迫性。在第三阶段,根据前两个阶段的研究结果,我们开始起草《准则》。在起草《准则》之前,我们回顾了模型中制订标准必须要考虑的关键因素。第二阶段的实证研究表明,《准则》并不应该仅仅为考试的开发者制订,而是应该包括考试的其他利益相关群体,如教育主管部门,考生和教师等等。只有考试所有的利益相关群体共同协作,才能真正保证考试的效度和公平性。而且通过第二阶段的研究,我们发现,在现阶段,我们无法在《准则》中起草强制性的实施条款。我们认为,目前的《准则》的目的应该是主要是教育性和启发性的。换言之,《准则》目的一共包括两个方面:一是提高语言测试者的质量和专业意识;二是向考试的利益相关群体传播考试开发、实施和使用的基本知识以及考试在各个阶段的良好做法。本研究的目的是通过制订《准则》,以期提高语言测试质量、效度和公平性,这在国内尚属首次。我们认为,本研究所制订的《准则》以及制订《准则》的过程,对于我国语言测试的理论和实践,都具有一定的参考价值。而且,本研究中提出的由教育性与启发性的广义标准向指导某个特定考试机构的具体测试标准的过渡,为我国语言考试机构制订适合自己情况的测试标准,提供了可操作的途径。当然,本研究的大部分工作都集中在《准则》的前期效度研究上(the a priori validation)。由于时间、精力和篇幅的限制,《准则》的后期效度研究(the a posteriori validation),不在本论文的研究讨论的范畴以内。在将来的研究中,需要对《准则》是否适合我国的英语考试进行调查研究,同时也要调查《准则》是否对我国的英语考试产生了预期的影响。
其他文献
目的评估交感神经皮肤反应(sympathetic skin response,SSR)和PD自主神经症状量表(the scale for outcomes in PD for autonomic symptoms,SCOPA-AUT)对帕金森病(Parkinson d
本文基于"语料库数据驱动"方法对当代中国外语界英语语言学的发展现状及趋势进行了全面的剖析。首先,笔者采用"语料库数据驱动"方法,对近5年(2005~2009)来7种外语类核心期刊
随着“十一五”建设社会主义新农村战略规划的提出,农村地区的建设和发展受到前所未有的关注和重视,与城市住宅相比,农村住宅的建设一直处于相对落后的局面。在东北地区,冬季
目前,有关学者已对农村留守儿童忽视问题进行了相关研究,但有关实践和理论还存在着不足。同时,农村留守儿童忽视问题对留守儿童的健康成长带来不可逆转的消极影响。因此,对我国童
英国当代著名作家朱利安·巴恩斯凭小说《终结感》获得了2011年英国布克文学奖,进一步拉近了他与中国读者的亲密接触。该小说的主题复杂,笔法精湛,构思巧妙,其叙事结构尤为独
异步电动机采用外转子结构, 可在同样外径的条件下增大电机的气隙直径,使电机具有功率因数高、效率高或节省材料、温升低、适用于自动化生产等优点。本文以冷却风机用电机为例,
目的:茯苓及其化学拆分组分抗胃癌细胞SGC-7901和乳腺癌细胞Bcap-37增殖的有效部位的研究。方法:MTT法和血清药理学方法测定茯苓石油醚、乙酸乙酯、多糖、大孔吸附树脂水洗物
就中药量效关系问题对国医大师李济仁教授进行的访谈。李老认为,中药用量和疗效之间存在很强的相关性;量效关系的主要影响因素包括:药物的炮制方法、配伍、煎煮法,以及患者的
从旧地方志资料研究民族服饰是一种十分重要的研究方法。本文通过对清代楚雄州旧方志有关彝族服饰资料进行收集梳理、归纳研究,力求探索清代楚雄州彝族服饰的基本概貌。
中华文化源远流长,博大精深。作为文化载体的文字,承载了丰富的内涵与信息。对""与""字的训诂,揭示出文字中所包含的文化信息,与现代科学理论研究成果一致,并有所创新。对"游