大学英语四级写作测试分项评分量表的制定及其效度研究

被引量 : 0次 | 上传用户:rylqy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,考试用户越来越关注考试分数的解释和意义,因此如何提供更加合理、清楚的分数解释,以便促进合理的使用分数就成为语言测试开发者面临的重要问题(Chapelle,Enright&Jamieson,2008)。在这种背景下,大规模外语考试中写作测试的效度越来越引起研究者的关注,因为写作测试所测量的语言能力往往不太明晰,极大地影响了考试用户对写作测试分数的理解。鉴于此,写作测试中使用的评分量表成为语言测试领域的研究热点。研究者们一致认为,评分量表体现了写作测试实际测量的语言能力(McNamara,1996;McNamara,2002;Turner,2000;Weigle,2002)。然而,现有的研究发现,大规模考试写作测试中使用的评分量表通常都存在一些问题(Brindley,1998;Knoch,2009;Todd,Thienpermpool&Keyuravong,2004;Upshur&Turner,1995)。目前,专门聚焦大规模考试中使用的写作评分量表的实证研究并不多见。考虑到写作测试在国内外大规模外语考试(如TOEFL、IELTS、CET、TEM)中的广泛应用,在此方面的研究不足亟待解决。本研究以大学英语四级考试写作测试(以下简称四级写作)为研究对象,主要运用实证的方法开发四级写作分项评分量表,并进一步验证该量表的效度。本研究旨在解决两个方面的问题:1.如何在实证研究的基础上开发四级写作分项评分量表?该问题可细分为以下三个具体问题:1)评分员如何看待现有的四级写作评分量表?2)如何界定四级写作测试的能力并在量表中落实该能力?3)如何确定四级写作分项评分量表的等级?2.用这种方法开发出的分项评分量表在评分中的效度如何?该问题可细分为以下三个具体问题:4)分项评分量表在四级写作测试评分中的总体效度如何?5)分项评分量表的不同评分维度在评分中的效度如何?6)评分员对分项评分量表的看法如何?本研究突破了传统的基于专家判断的量表制定方式,采用多阶段、多方法的研究模式来开发四级写作分项评分量表,并对其进行效度验证。具体而言,第一阶段采用混合研究方法,调查评分员对四级写作现有的评分量表的意见,确定四级写作测试的评分标准。179位四级写作评分员参加了问卷调查,对问卷数据进行定量分析。其中有12位评分员参与了后续访谈。他们的意见被录音、转写,并进行定性分析,补充并进一步解释定量分析的结果。第二阶段综合运用文档分析、直觉判断和Rasch模型分析,为四级写作量表挑选合适的描述语,并测量描述语的难度。首先,在分析现有的量表、课程要求、教学大纲和课本等材料的基础上,构建了描述语库,并对收集的描述语进行编辑和分类。然后,组织6位资深四级写作评分员,以工作坊的形式对描述语进行筛选、改写和整理,提升描述语的清晰度以及与四级写作表现的相关度。最后,将筛选出的描述语归类纳入相应的量表参数框架体系中,并编制问卷,调查四级写作评分员对描述语难度的意见。根据问卷调查的结果,拟定了四级写作分项评分量表的初稿。该量表包含4个评分维度(语言的广度和准确性、内容和思想、篇章组织、语言的得体性),89条描述语,分5个等级来描述被测的写作表现。上述两个研究阶段均属量表的开发阶段,而第三阶段则专注于量表的效度研究。该阶段采用混合研究方法,分别收集关于量表事后效度的定量、定性证据,并进一步完善量表。首先,21位评分员受邀参加采用“对抗平衡”设计的评分实验,使用现有的四级写作评分量表和本研究开发的四级写作分项评分量表对同样30篇四级作文进行评分。评分实验结束后,研究者对部分评分员进行深入访谈,进一步了解他们对四级写作分项评分量表的意见和建议。最后,结合评分实验数据和访谈数据分析的结果继续对量表进行修改。实验的结果表明,无论从整体还是从分项评分标准来看,本研究开发的四级写作分项评分量表在评分中都比较有效。评分员对量表的看法大都比较肯定。同时,根据量表事后效度验证的结果,本研究进一步精简了描述语的数量、修改了描述语的措辞,并微调了个别分量表等级的划分,进一步提升了量表的质量。总的来说,本研究聚焦四级写作分项评分量表的开发和效度验证,这种基于实证数据为大规模写作测试开发评分量表的做法,一方面有助于解决现有的四级写作测试评分量表的效度问题,另一方面对其他测试环境下评分量表的开发和效度验证也具有理论和方法上的参考价值。
其他文献
根据排屑器故障建立故障树,分析其产生的直接原因,通过对故障原因机理进行推理,分析得出发生故障的实质原因,并提出排屑器改进设计方案。
当前形势下,城市园林景观建设质量在不断提升,然而绿色环保理念在城市园林景观中的应用备受人们青睐。城市园林景观除了基本常见的植物外,设计者还将农业经济作物融入到园林
从探索实行社会主义市场经济体制到世界第二大经济体,从'摸着石头过河'到满怀信心地'走出去'……弹指一挥间,从新中国成立到现在,已经走过70个春秋。在这70
目的实验研究对耐多药肺结核患者实施健康教育的辅助治疗效果。方法将本医院2018年6月-2019年5月收治的耐多药肺结核患者59例,作为研究对象,利用抽签法分为两组,实验组和对照
<正>【裁判要旨】人民法院判决确定股权归属,直接产生股东对公司的请求权,可据此要求在股东名册、公司章程、工商登记等证明权利归属文件上予以公示。实际出资人隐名出资的,
在农机技术推广过程中,为实现推广效率,应该对农机现代化技术进一步宣传,在进行有效推广阶段,应该结合实际,并制定科学的推广方案。从推广现状入手,积极分析其存在的不足,以
混沌系统具有优越的密码特性,使其适用于加密系统,对混沌系统的分析发现在流密码加密过程中,混沌系统产生的不均匀序列是无法直接运用的,否则容易被分析破解。本文综述了现有
云南宁州文人王元翰,明神宗万历年间先后担任吏、工两科给事中,曾就政治腐败的大量事实,多次作出书面诤谏。后来受到迫害,弃官出走,最后流落省外,穷死异乡。本文对王氏生平及
文明是人类社会发展到一定阶段的标志。一般认为 ,人类从野蛮向文明过渡的标志是文字、城市、青铜器和国家等的出现。中国和希腊是世界上最早进入文明时代的国家之一。通过对
介绍并分析新旧箱梁桥间不同的拼宽方法。以一个拼宽箱梁为例,选定合适的拼宽方法,对拼宽箱梁的荷载横向分布系数采用不同方法进行计算。通过与有限元结果比较得到接近该类桥