论文部分内容阅读
EFL写作评估受到语言测试领域的研究者以及从事外语写作教学的教师们的长期关注,因为它需要评分员以评分量表为基础做出主观决策,这就为语言测试领域带来了一些有争议的问题。在中国,高考是一项大规模高风险测试,其测试结果被用来做出高风险决策,因此,它对个人和教育机构意义重大。英语写作评分过程涉及到评分员和评分量表两个因素。在国内的语言测试领域,对评分过程的研究仍属空白,而对写作评估中评分员和评分量表的关系的研究,尤其是对高考作文评分中这一关系的系统的实证研究做得很少。本文的研究目的在于对高考英语写作评分中评分员和评分量表的关系进行实证研究,并探索评分员和评分量表在高考写作评分中的重要性。具体说来,本研究旨在调查评分员如何解释和使用评分量表,并通过比较整体评分量表和分项评分量表的作用,调查不同的评分量表如何影响评分行为和评分结果,最终证明评分员培训的必要性和重要性并找出其他提高评分信度的方法。本研究从定性和定量两方面分析了评分员和评分量表在高考写作评分中的关系。在2009年夏季的高考评卷工作早期,笔者使用了一个包含8个问题的问卷来调查高考评分员对高考写作评分的看法。收回问卷之后,笔者分析、总结评分员的看法,并根据问题5的结果和高考写作评分中所用的整体评分量表,设计出一个分项量表以备后用。从参与问卷调查的评分员中,笔者随机选出8位对10篇作文样本进行整体性和分析性评分。根据Rasch分析的结果,笔者对比了在两种不同类型评分量表基础之上的评分员的决策。研究结果表明评分员在量表的解释和使用上存在差异,这可能会导致评分结果的差异。研究结果还表明,在高考写作评分中,大部分评分员根据评分量表给出分数,不同的评分量表可能会导致不同的评分员行为,最终这两个因素可能会影响评分结果。即使使用同一评分量表,评分员在评分量表的解释和使用上也可能有所不同。结果证明,整体评分量表由于其较高的信度而更加适合用于高考英语写作评分。针对评分员之间的不一致性,本文建议采取评分员培训和对评分量表更加细化。