论文部分内容阅读
词汇评估是二语习得研究的一个重要领域。词汇丰富性是二语学习者口笔语词汇产出能力的重要评估类别,该类别包含的指标及其测量的准确性是近几十年二语词汇评估中的热点问题。词汇丰富性的测量指标包括词汇多样性、词汇复杂度、词汇密度和词汇独特性等。其中,二语学习者词汇复杂度的测量方法是最引起争议的。前期研究中二语学习者词汇复杂度的三种测量方法—词频概貌(Lexical Frequency Profile, LFP),P_Lex,Advanced D都声称自己是最好的,但哪一种最佳还没有达成一致。因此,本研究旨在通过比较二语学习者词汇复杂度的三种测量方法,试图找出最佳的测量方法,并为词汇研究测量提供新路子。具体研究以下问题:1)从信度方面看,二语学习者词汇复杂度的三种测量方法哪种最佳?2)从效度方面看,二语学习者词汇复杂度的三种测量方法哪种最佳?为分析三种测量方法的信度,本研究使用50名英语专业三年级学生的两套同一题材的随堂限时作文,第二篇作文与第一篇作文相隔两周。本研究从构念效度和共现效度两个方面分析三种测量方法的效度。二语学习者词汇复杂度的构念效度的研究涉及到测量文本长度和高级词的变化性对三种测量方法的影响。本研究通过对来自于TEM-8考试作文中的三篇作文进行描述性分析检验三种测量方法的构念效度。三篇作文对应的分数分别是18分,13分,9分,它们依次称作高、中、低水平组。基于这三篇作文得到的计算机模拟数据用于测量高级词的变化性对三种测量方法的影响。在第一种模拟中,高级标记总数保持不变,高级词型数依次减少,在第二种模拟中,高级标记数随高级词型数依次下降。为分析三种测量方法的共现效度,本研究从英语专业八级考试作文中随机选取80篇作文。本研究中学习者八级作文成绩(满分为20分)分布在8~18分之间,其中分布最集中的两个分值是12和13分,我们按这两个分值将作文成绩分为两个等级:8~12分的学习者为低水平组,共42人;13~18分的学习者为高水平组,共38人。本研究的主要发现如下:信度方面,皮尔逊相关分析发现,两组作文中二语学习者词汇复杂度的三种测量方法均达到显著的相关,但是相关度不高(LFP:r1=.327, p1=.020﹤.05;P_Lex:r2=.308, p2=.030﹤.05;Advanced D:r3=.441, p3=.001﹤.05)。配对样本t检验表明,两组作文的词汇复杂度有显著差异(LFP:t1=4.804, p1=.000﹤.05;P_Lex:t2=8.837, p2=.000﹤.05;Advanced D:t3=-2.742,p3=.008﹤.05)。构念效度方面,在测量文本长度对三种测量方法的影响时,LFP,P_Lex和Advanced D对文本长度的最低要求分别是200个词,120个词和120个词。但是Advanced D要略好于P_Lex,因为在中低水平组作文中Advanced D获得较为稳定的结果是60个词,而P_Lex是120个词。在测量高级词的变化性对三种测量方法的影响时,三篇不同水平作文的LFP和P_Lex的词汇复杂度值在第一种模拟中几乎保持不变,而在第二种模拟中不断下降波动。然而,Advanced D在两种模拟中的词汇复杂度值均呈现不同程度的变化。这表明Advanced D在测量高级词的变化性对词汇复杂度的影响时要好于P_Lex和LFP。共现效度方面,相关分析发现三种测量方法与学习者英语作文质量呈现微弱正相关(LFP:r1=.248, p1=.027﹤.05;P_Lex:r2=.253, p2=.024﹤.05;Advanced D:r3=.257, p3=.021﹤.05),词汇复杂度和词汇多样性呈现正相关(LFP:r1=.332, p1=.003﹤.05;P_Lex:r2=.236, p2=.035﹤.05;Advanced D:r3=.340, p3=.002﹤.05),且Advanced D和LFP略高于P_Lex。总之,Advanced D和P_Lex在控制文本长度对二语学习者词汇复杂度影响方面要比LFP更稳定。而在测量高级词的变化性对词汇复杂度影响方面,Advanced D要好于P_Lex和LFP。综上所述,无论从信度看还是效度看,AdvancedD是三种方法中最佳的词汇复杂度测量方法。本研究不仅在方法论上对二语学习者词汇复杂度测量做出了贡献,而且对词汇评估也有重要意义。