论文部分内容阅读
效度研究一直以来都是语言测试研究的一个重点。在汉语官方考试中,新中小考生汉语测试(Youth Chinese Test,简称YCT)覆盖面越来越广,参加的考生日益增多,而对该考试进行效度研究的成果还未见到。本研究基于新的效度观,选取新YCT二级考试,从测试使用者的角度在美国罗德岛的两所开设汉语的中学收集了来自测试内部和外部的多方面证据:包括测试信度、测试内容及结构、组间比较、效标(教师评价)以及考生的态度等。研究发现:(1)信度方面,该测试整体、听力和阅读分测试以及大部分题型的信度系数较理想。(2)测试内容和结构方面,测试总体覆盖了内容大纲中的语言功能和词汇;听力部分分数和阅读部分分数呈中等显著相关,说明考察的是不同的能力;从测试的表面效度来看大部分考察的是大纲要考察的内容。(3)从组间比较来看,测试能较好区分在美国每周学习5小时、连续学习两个学期、总课时160课时以下的初级学习者的汉语水平;也能够较好地区分不同学校考生的汉语水平。(4)从问卷调查中考生对题型的态度看,考生认为新YCT各部分时间设置较为合适,有的考生认为示例理解有一些困难,图片和拼音对他们理解问题有较大帮助,且考试内容与课本相关性不高,但贴近日常生活,试题属于较为真实性的试题。多数考生认为为了备考YCT,需要进行一些训练,但看法差别较大。此外,本文还发现,题型的难易度与考生分数相关;题型的趣味性与考生分数相关不显著且相关值很低;而考察度则与听力部分的成绩相关。(5)来自效标关联效度的证据看,教师评价与YCT二级测试成绩的相关系数很高且显著,也证明该测试成绩能较好地区分水平不同的学习者。总体而言,YCT二级测试能够有效测量出在非目的与环境中学习了160学时以下考生的汉语水平。不过,该测试也有个别题型区分度不显著,难度较低;听力和阅读部分有个别语言功能没有涉及或涉及很少;此外,测试不能较好地区别汉语水平较高的学习者的能力,但这符合测试设计者的初衷。根据研究结果,本研究对YCT考试提出了建议。本研究采用统计分析、问卷调查以及访谈等不同方法多角度收集效度证据,较为全面地考察了新YCT二级考试的效度,并对该考试今后的发展提出了建议。然而由于条件所限,调查样本不够大,未能使用一些其他统计方法,也未能从更多的方面搜集证据。在今后的研究中,可以收集范围更广、容量更大的样本进行研究,也可以对其他三个级别的测试进行研究,从更多的方面搜集效度证据并使用其他统计方法进行分析。此外,测试题目的社会公平性问题(Differential Item Functioning,DIF)也有待考察。