论文部分内容阅读
我国大学英语听力测试,就影响规模和涉及的广泛性来讲,在中高级英语听力测试中占有重要的地位。从语言测试学角度来研究现行大学英语听力测试的真实性,不仅具有重要的学术意义,更重要的是还具有较好的社会学意义。视听结合测试方式(多媒体方式)比只听测试方式(磁带方式)更具有优良性,已经引起国内外广大学者与考试机构高度重视,但相关的实证研究尚不多见。要研究一种考试方式比另外一种考试优良,通常把这两种测试方式当作实验处理(变量),在一个较大范围内进行抽样,然后进行统计比较,这在实际操作与统计学上存在三方面的困难:适当而合理的分离出变量,也就是我们真正确定差异是由测试方式引起,而不是由于其它相关因素影响造成;抽样的独立同分布特性;统计结果的可推断性。因此,为探索大学英语听力测试的真实性,本文依据现行大学英语四(六)级听力考试大纲和语言测试的真实性原则,选用《洪恩环境英语》(中高级)作为视频材料,并借鉴环球雅思听力测试的部分题型,设计出18套听力测试试卷,利用只听和视听两种不同的测试方式对不同试验组分别进行了连续18次测试,采用了基于二阶矩建模方法中的随机波动模型(SV),并通过MCMC方法对SV模型后验分布参数进行了模拟。结果显示:在基本SV模型三个参数中,只听与视听结合方式的波动持续性参数相同,说明了两种测试方式中,前期波动对后来的波动影响相似;两种测试方式的精度参数也相同,表明了这两种测试方式在受到如信度、效度等外界噪音影响时,其水平相近。这两个参数相同,符合Bachman语言测试质量的可信性、结构效应和真实性三个准则。然而,只听比视听测试方式的平均波动水平参数明显高出72.06%,揭示了只听测试方式比视听测试方式更容易发生波动,即后者比前者更具稳定性,视听测试方式比只听测试方式更能反映测试者的真实成绩;进一步分析得知,视听方式比只听方式更能满足Bachman语言测试质量的其它三个准则:相互作用性、后效作用和适用性。