论文部分内容阅读
内容摘要:现代汉语的多义词义项丰富,是二语学习者词汇学习的一大难点。多义词“上”的“NP上”词组搭配使用频率高,本文将基于“HSK动态作文语料库”,从学习者“NP上”各义项的使用频次和习得成绩两方面来考察学习者深度习得情况,探究汉字文化圈学习者“NP上”三个义项的大致习得顺序,并对其进行偏误分析。
关键词:“NP上” 习得顺序 义项 偏误
汉语中词类和句法成分关系复杂,兼类词的情况比较多见。多义词“上”在《现代汉语词典》(第七版)中被列为一级字(常用汉字),并分别出现在《HSK词汇等级大纲词表》的五个级别中,可见“上”的习得贯穿汉语作为第二语言习得整个过程,值得引起重视。在HSK动态作文语料库(以下简称语料库)中输入汉语“上”,得到语料数计8893条。可见汉语二语学习者使用“上”的频率较高,其中,以汉字文化圈国家为母语背景的留学生语料占比最高,高达90%以上。因此,本文选取了汉字文化圈学习者作为研究对象,考察“NP上”的习得顺序。需要说明的是,此处所指“汉字文化圈”为黄伯荣、廖旭东第六版《现代汉语》中提到的“在历史发展过程中或多或少使用过汉语的国家日本、韩国、朝鲜、新加坡、越南”等国家。
多义词“上”意义丰富,仅读音便有上(shǎng)、上(shàng)、上(shàng)三个,《现代汉语词典》(第七版)中依词义便将“上”分了五类,本文欲将探究的“NP上”在《詞典》中是“上5”,所含义项有三:
上1:表示物体的表面。如脸~、桌子~
上2:表示在某种事物的范围内。如会~、书~
上3:表示某一方面。如事实~、思想~
笔者查阅了有关习得顺序研究方法的相关成果,发现从1987年到2019年的数十篇论文中确定习得顺序的方法大致有以下九种:正确率排序法、使用率排序法、正确使用相对频率法、阶段计分法、蕴含量表法、错误率排序法、使用频次排序、偏误率排序法和Q—SCORE算法,且单篇论文大多使用一至三种。因此,本文综合正确使用相对频率法、正确率法和阶段计分法三种研究方法作为探究“NP上”习得顺序的工具。
一.数据分析
本文采取随机抽样的方法,在HSK动态作文语料库中随机抽取了2000条“NP上”的语料,通过成绩由低到高排列,把考生分为低、中、高三个水平:最低分为122,最高分为449,按照等分间隔,122-231分为初级水平,232-341为中级水平,343-450为高级水平。
上1共出现66次,错误数为10次:初、中、高级水平的正误次数分别为5/2,29/5,22/3;上2共出现1255次,错误数为147:初、中、高级水平的正误次数分别为46/10,815/107,247/30;上3共出现679次,错误数为127次:初、中、高级水平的正误次数分别为37/17,290/66,225/44。
(一)正确使用相对频率法
正确使用相对频率法是为解决语料分布不均,且有些义项样本容量小,无法进行等量随机抽样的问题,从而使数据具有可比性。该算法可建立在如下假设上:在语料库出现的语料中,义项的正确使用频次或正确使用相对频率越高,就越容易,越早习得。具体方法为:各义项在各等级上的正确使用相对频率=各义项在各等级上的正确使用频次/某学时等级上所有义项的出现频次之和。三个义项在初级、中级、高级上的正确使用相对频率的结果分别为上1:0.04、0.02、0.04;上2:0.39、0.62、0.43;上3:0.30、0.22、0.39。
也就是说,“NP上”的三个义项的正确率在总体趋势上是随着汉语水平的提高呈上升趋势的,“上1、上2”在高级水平较中级正确率反而有所下降。三个义项的习得顺序为上2
关键词:“NP上” 习得顺序 义项 偏误
汉语中词类和句法成分关系复杂,兼类词的情况比较多见。多义词“上”在《现代汉语词典》(第七版)中被列为一级字(常用汉字),并分别出现在《HSK词汇等级大纲词表》的五个级别中,可见“上”的习得贯穿汉语作为第二语言习得整个过程,值得引起重视。在HSK动态作文语料库(以下简称语料库)中输入汉语“上”,得到语料数计8893条。可见汉语二语学习者使用“上”的频率较高,其中,以汉字文化圈国家为母语背景的留学生语料占比最高,高达90%以上。因此,本文选取了汉字文化圈学习者作为研究对象,考察“NP上”的习得顺序。需要说明的是,此处所指“汉字文化圈”为黄伯荣、廖旭东第六版《现代汉语》中提到的“在历史发展过程中或多或少使用过汉语的国家日本、韩国、朝鲜、新加坡、越南”等国家。
多义词“上”意义丰富,仅读音便有上(shǎng)、上(shàng)、上(shàng)三个,《现代汉语词典》(第七版)中依词义便将“上”分了五类,本文欲将探究的“NP上”在《詞典》中是“上5”,所含义项有三:
上1:表示物体的表面。如脸~、桌子~
上2:表示在某种事物的范围内。如会~、书~
上3:表示某一方面。如事实~、思想~
笔者查阅了有关习得顺序研究方法的相关成果,发现从1987年到2019年的数十篇论文中确定习得顺序的方法大致有以下九种:正确率排序法、使用率排序法、正确使用相对频率法、阶段计分法、蕴含量表法、错误率排序法、使用频次排序、偏误率排序法和Q—SCORE算法,且单篇论文大多使用一至三种。因此,本文综合正确使用相对频率法、正确率法和阶段计分法三种研究方法作为探究“NP上”习得顺序的工具。
一.数据分析
本文采取随机抽样的方法,在HSK动态作文语料库中随机抽取了2000条“NP上”的语料,通过成绩由低到高排列,把考生分为低、中、高三个水平:最低分为122,最高分为449,按照等分间隔,122-231分为初级水平,232-341为中级水平,343-450为高级水平。
上1共出现66次,错误数为10次:初、中、高级水平的正误次数分别为5/2,29/5,22/3;上2共出现1255次,错误数为147:初、中、高级水平的正误次数分别为46/10,815/107,247/30;上3共出现679次,错误数为127次:初、中、高级水平的正误次数分别为37/17,290/66,225/44。
(一)正确使用相对频率法
正确使用相对频率法是为解决语料分布不均,且有些义项样本容量小,无法进行等量随机抽样的问题,从而使数据具有可比性。该算法可建立在如下假设上:在语料库出现的语料中,义项的正确使用频次或正确使用相对频率越高,就越容易,越早习得。具体方法为:各义项在各等级上的正确使用相对频率=各义项在各等级上的正确使用频次/某学时等级上所有义项的出现频次之和。三个义项在初级、中级、高级上的正确使用相对频率的结果分别为上1:0.04、0.02、0.04;上2:0.39、0.62、0.43;上3:0.30、0.22、0.39。
也就是说,“NP上”的三个义项的正确率在总体趋势上是随着汉语水平的提高呈上升趋势的,“上1、上2”在高级水平较中级正确率反而有所下降。三个义项的习得顺序为上2