母语背景因素对中高级水平学习者书写汉字的影响

来源 :现代语文(语言研究) | 被引量 : 0次 | 上传用户:chenjianhao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文通过统计分析发现,以汉语作为第二语言的中高级水平学习者的汉字书写任务中,母语背景因素在独体字书写方面不具有显著差异,而在合体字书写方面具有显著差异,具体表现为日本学生、欧美学生与韩国学生的汉字书写错误率递增。影响独体字书写的主要因素是字形特征(笔画),影响合体字书写的主要因素是字形特征(部件、结构类型)与母语背景。我们建议在汉字教学中明确区分独体字与合体字,充分重视母语背景因素在两种不同类型的汉字学习过程中的影响。
  关键词:字形特征 母语背景 汉字教学 汉字习得 国别化
  一、引言
  汉字构形学与汉字习得规律密切相关,在汉字教学与习得研究中有很强的实用性。目前,对外汉语教学中字形因素对汉字习得的影响研究主要集中在汉字的笔画数、部件数、结构类型(拓扑结构)、对称性等方面,研究对象也限定在汉字文化圈或非汉字文化圈当中。中高级汉语水平学习者的书写任务中,笔画数效应显著、部件数效应与结构类型效应不显著,这三个字形因素对汉字文化圈学习者书写汉字的影响程度不同。这些字形特征对非汉字文化圈、对不同母语背景学习者的影响是否具有差异呢?这是本文试图回答的问题。
  二、语料与方法
  本研究的语料来自“HSK动态作文语料库”,它是母语非汉语的学习者参加中国汉语水平考试HSK高等作文考试的作文语料库。该语料库能够反映中高级水平学习者的汉语习得情况。
  我们从该语料库中分别提取了母语为日语和韩语的语料,以及来自欧美地区(母语属印欧语或斯拉夫语)的学生的语料。这三部分语料的规模和用字情况见表1。为了进行比较,我们把研究范围限定在3500个常用字范围内,以三部分语料的共有错字(共466个)为研究对象建立了数据库。数据库的主要字段包括汉字、笔画数、部件数、结构类型①、使用频次、错误频次、错误率②和母语背景。本文所说的字的错误是指该语料库中标注为“错字”的情况,即字形书写有误,不包括“别字”。别字不属于汉字字形错误,是因为它在音、义或形方面与所对应的那个正字有联系而产生的。这方面的研究已经超出了本文的讨论范围。
  表1:语料规模和用字情况
  日语母语 韩语母语 欧美地区
  字型 字次 字型 字次 字型 字次
  用字 2698(2585) 1018173(1017954) 2657(2544) 1331771(1331585) 2343(2247) 229948(229779)
  错字 1142(978) 11895(9827) 1362(1189) 19618(16543) 609(607) 1686(1684)
  错误率 42.33%(37.83%) 1.17%(0.97%) 51.26%(46.74%) 1.47%(1.24%) 25.99%(27.01%) 0.73%(7.33%)
  (注:括号中的数据是在3500个常用字范围内的考查结果。)
  确定汉字笔画数的主要依据是“汉字属性数据库”,该数据库以《信息处理用GB13000.1字符集汉字部件规范》(GF3001—1997)为标准拆分部件。确定部件数和结构类型的依据是《现代常用独体字规范》(GF0013—2009)和《现代常用字部件及部件名称规范》(GF0014—2009)。这两个规范在部件和结构类型的界定上更符合汉字教学的需求和汉字习得的规律。为了便于统计和与同类研究进行比较,我们根据这两个规范将汉字的结构类型归纳为独体、左右、上下、包围和框架结构(如“乘”“幽”)5大类。由于框架结构的字太少,统计分析中暂且忽略了这种结构类型。
  笔画和部件是现代汉字的结构成分。笔画数和部件数是关于汉字结构成分的数量方面的统计量,结构类型是汉字的结构成分的组合方式。合体字有笔画、部件、整字三个结构层次,独体字则直接由笔画构成。独体、合体因素与笔画多少存在一定关联,即与合体字相比,独体字的平均笔画数较少。独体字与合体字书写的具体错误不同,第二语言学习者对这两类汉字的认知可能存在不同的心理过程。“独体、左右、上下和包围”这4种结构类型并不是一次划分得来的。“独体”与“合体”对立,而“合体”又分为3种类型。我们认为,在考察有关汉字结构成分数量方面的因素(即笔画数和部件数)对汉字书写错误的影响时,首先要区分独体字与合体字,下文将独体字与合体字称为汉字类型因素。虽然结构类型因素与部件数因素分别是合体字的构成成分在数量和结合方式方面的统计量,但是本文所说的“结构类型”是指合体字的首层结构类型,没能充分反映出合体字的构成成分在彼此结合时的多层次复杂性,本文所说的“部件数”却是指对合体字进行多层次地详尽切分后得到的部件数量,因此这两个统计量也不在同一个分析层面。基于上述认识,我们首先考察汉字的类型和母语背景对汉字书写错误率的影响,然后考察笔画数和母语背景对独体字的书写错误率的影响,最后分别考察结构类型与母语背景、部件数与母语背景对合体字的书写错误率的影响。
  三、数据
  根据我们的观察,语料库中汉字的书写错误率不服从正态分布。为了满足研究方法中正态分布的统计前提,我们对错误率进行了取自然对数的数据转换。经转换后的Ln(错误率)服从正态分布(M=—4.100,SD=1.966)。以下的统计分析均使用Ln(错误率)作为因变量,分析比较结果时给出反转换后的平均错误率。
  (一)汉字类型与母语背景
  为了控制笔画数的影响,我们选择了数据库中4~8画的字作为研究对象。这些字分为独体字与合体字两个水平。表2是不同水平的汉字的书写错误率。经方差分析发现,在ɑ=0.05的显著性水平下(下同),独体/合体因素与母语背景因素的交互作用不显著(F(2,666)=0.154,p=0.858),独体/合体因素的主效应显著(F(1,666)=14.943, p=0.000),母语背景因素的主效应不显著(F(2,666)=2.367, p=0.095)。
  表2:汉字类型因素与母语背景因素对书写错误率的影响   字数 Ln(错误率)均值 标准差 反转换后的错误率
  独体 153 —4.692 1.135 0.009
  合体 519 —4.290 1.135 0.014
  欧美 224 —4.420 1.152 0.012
  日本 224 —4.516 1.238 0.011
  韩国 224 —4.207 1.022 0.015
  (二)独体字:笔画数与母语背景
  我们把数据库中的73个独体字划分为少笔画字(1~3画)、中笔画字(4~6画)和多笔画字(7画及以上)三个水平。表3是不同水平的独体字的书写错误率。经方差分析发现,笔画数因素与母语背景因素的交互作用不显著(F(4,210)=0.137,p=0.969),笔画数因素的主效应显著(F(2,210)=8.957,p=0.000),母语背景因素的主效应不显著(F(2,210)=0.673,p=0.511)。经多重比较(Scheffe检验,下同)发现,少笔画字的错误率和中笔画字的错误率均显著低于多笔画字的错误率,而少笔画字与中笔画字之间的错误率差异不显著(见表4)。
  表3:笔画数因素与母语背景因素对独体字书写错误率的影响
  字数 Ln(错误率)均值 标准差 反转换后的错误率
  少笔画字 45 —5.257 1.426 0.005
  中笔画字 105 —4.901 1.081 0.007
  多笔画字 69 —4.354 1.052 0.013
  欧美 73 —4.868 1.215 0.008
  日本 73 —4.870 1.274 0.008
  韩国 73 —4.667 1.089 0.009
  表4:独体字中笔画数因素的多重比较(Scheffe检验)
  Ln(错误率)均值差值 标准差 p值 置信区间上限 置信区间下限
  少笔画字—中笔画字 —0.357 0.207 0.229 —0.867 0.154
  少笔画字—多笔画字 —0.903 0.223 0.000 —1.452 —0.354
  中笔画字—多笔画字 —0.546 0.180 0.011 —0.990 —0.103
  (三)合体字:结构类型与母语背景
  我们把数据库中393个合体字的结构类型划分为“上下、左右、包围”结构三个水平。表5是不同水平的合体字的书写错误率。经方差分析发现,结构类型因素和母语背景因素的交互作用不显著(F(4,1170)=0.186,p=0.946),结构类型因素的主效应显著(F(2,1170)=14.891,p=0.000),母语背景因素的主效应显著(F(2,1170)=5.229, p=0.005)。经多重比较发现:日本学生的汉字书写错误率显著低于韩国学生的汉字书写错误率,日本学生与欧美学生间的汉字书写错误率差异不显著,韩国学生与欧美学生间的汉字书写错误率差异不显著(见表6);左右结构字和上下结构字的书写错误率均显著低于包围结构字的书写错误率,左右结构字与上下结构字之间的书写错误率差异不显著(见表7)。
  表5:结构类型因素与母语背景因素对书写错误率的影响
  字数 Ln(错误率)均值 标准差 反转换后的错误率
  左右结构字 651 —4.075 1.121 0.017
  上下结构字 339 —3.994 1.094 0.018
  包围结构字 189 —3.565 1.269 0.028
  欧美 393 —3.967 1.204 0.019
  日本 393 —4.117 1.200 0.016
  韩国 393 —3.826 1.026 0.022
  表6:合体字中母语背景因素的多重比较(Scheffe检验)
  Ln(错误率)均值差值 标准差 p值 置信区间上限 置信区间下限
  欧美—日本 0.150 0.081 0.179 —0.048 0.349
  欧美—韩国 —0.141 0.081 0.218 —0.340 0.057
  日本—韩国 —0.292 0.081 0.002 —0.490 —0.093
  表7:合体字中结构类型因素的多重比较(Scheffe检验)
  Ln(错误率)均值差值 标准差 p值 置信区间上限 置信区间下限
  左右结构—上下结构 —0.082 0.076 0.562 —0.268 0.105
  左右结构—包围结构 —0.510 0.094 0.000 —0.740 —0.280
  上下结构—包围结构 —0.428 0.103 0.000 —0.681 —0.176
  (四)合体字:部件数与母语背景
  我们把数据库中393个合体字按照部件数量划分为2部件字、3部件字和多部件字(4个或4个以上部件)三个水平。表8是不同水平的合体字的书写错误率。经方差分析发现,部件数因素和母语背景因素的交互作用不显著(F(4,1170)=0.756,p=0.599),部件数因素的主效应显著(F(2,1170)=25.925,p=0.000),母语背景因素的主效应显著(F(2,1170)=2.856,p=0.050)。经多重比较发现:日本学生的汉字书写错误率显著低于韩国学生的汉字书写错误率,日本学生与欧美学生间的汉字书写错误率差异不显著,韩国学生与欧美学生间的汉字书写错误率差异不显著(见表9);2部件字和3部件字的书写错误率均显著低于多部件字的书写错误率,2部件字的书写错误率显著低于3部件字的书写错误率(见表10)。
  表8:结构类型因素与母语背景因素对书写错误率的影响
  字数 Ln(错误率)均值 标准差 反转换后的错误率
  2部件字 624 —4.176 1.139 0.015
  3部件字 414 —3.814 1.102 0.022   多部件字 141 —3.517 1.156 0.030
  欧美 393 —3.967 1.204 0.019
  日本 393 —4.117 1.200 0.016
  韩国 393 —3.826 1.026 0.022
  表9:合体字中母语背景因素的多重比较(Scheffe检验)
  Ln(错误率)均值差值 标准差 p值 置信区间上限 置信区间下限
  欧美—日本 0.150 0.080 0.173 —0.046 0.347
  欧美—韩国 —0.141 0.080 0.212 —0.338 0.055
  日本—韩国 —0.292 0.080 0.001 —0.488 —0.095
  表10:合体字中部件数因素的多重比较(Scheffe检验)
  Ln(错误率)均值差值 标准差 p值 置信区间上限 置信区间下限
  2部件字—3部件字 —0.362 0.071 0.000 —0.537 —0.188
  2部件字—多部件字 —0.659 0.105 0.000 —0.915 —0.402
  3部件字—多部件字 —0.297 0.110 0.026 —0.565 —0.028
  (五)结构类型对不同母语背景的学生汉字书写错误比例的影响
  本研究所用语料使用的汉字大约为2500字左右(见表1),因此我们考察了不同结构类型的汉字在2500常用字中的数量和比例,并与不同母语背景的语料用字情况进行了比较。如表11所示,三种母语背景的学生语料中使用的独体字数量与2500常用字中的独体字数量基本相当,但日本与韩国学生的使用错误率均超过了50%,而欧美学生独体字的错误率却不足35%;同样地,欧美学生的三种合体字(左右结构字、上下结构字、包围结构字)的使用错误率也明显低于日本学生与韩国学生。
  表11:结构类型在2500常用字与不同母语背景学生用字中的分布情况③
  范围 独体字 左右结构字 上下结构字 包围结构字 合计
  2500常用字 257(10.28%) 1358(54.32%) 641(25.64%) 237(9.48%) 2493
  日本学生错字 158(13.84%) 563(49.30%) 290(25.39%) 121(10.60%) 1142
  日本学生用字 266(9.89%) 1493(55.50%) 684(25.43%) 247(9.18%) 2690
  日本学生错字比例 59.40% 37.71% 42.40% 48.99% 42.45%
  韩国学生错字 170(12.48%) 686(50.37%) 348(25.55%) 146(10.72%) 1362
  韩国学生用字 268(10.13%) 1460(55.14%) 665(25.11%) 255(9.63%) 2648
  韩国学生错字比例 63.43% 46.99% 52.33% 57.25% 51.44%
  欧美学生错字 85(13.96%) 298(48.93%) 151(24.79%) 73(11.99%) 609
  欧美学生用字 243(10.41%) 1262(54.05%) 600(25.70%) 230(9.85%) 2335
  欧美学生错字比例 34.98% 23.61% 25.17% 31.74% 26.08%
  (注:括号中的数字为相应字数在考察范围[行合计]中的比例。)
  四、讨论
  (一)关于研究结果
  由上述统计发现,以汉语作为第二语言学习者的汉字书写任务当中,母语背景因素在独体字书写方面不具有显著差异,即独体字的书写任务中起主要作用的是字形特征;母语背景因素在合体字书写方面具有显著差异,具体表现为日本、欧美、韩国学生的书写错误率依次递增,且日本与韩国学生间的书写错误率差异显著;除了母语背景因素外,结构类型因素与部件数因素也是影响合体字书写错误率的关键因素,在三种母语背景的学生群体中均表现为左右结构字、上下结构字的书写错误率显著低于包围结构字的书写错误率,2部件字、3部件字与多部件字的错误率显著递增。
  (二)关于研究方法
  根据本文的统计数据,欧美学生在独体字与合体字使用错误率方面表现为明显低于日韩学生;母语背景因素的主效应在合体字书写错误率方面均表现为日本学生低于欧美学生,欧美学生低于韩国学生。对此我们认为,本文研究用的三种母语背景的语料规模不均衡,其中日本与韩国学生的语料均为100万字,而欧美学生的语料仅有23万字。欧美学生汉字书写水平是否真的优于日韩学生或介于二者之间,还需要补充语料或从其他角度进一步深入研究。
  (三)对汉字教学的启示
  母语背景因素在独体字与合体字的书写任务中具有不同作用,这也再次说明第二语言学习者对这两类汉字的认知存在不同心理过程。那么,就汉字教学而言,就应当明确区分独体字与合体字的教学。独体字教学中应该强调笔形、笔画及笔画间的空间位置关系,没必要或少在国别化教学方面花些功夫。而在合体字教学当中,在关注字形结构特征(部件、结构类型)的同时,也应该在不同母语背景的学生学习掌握汉字的规律与差异方面给予充分重视。
  五、结语
  本文通过对“HSK作文语料库”中日本、韩国、欧美学生的汉字书写数据的统计分析发现,母语背景因素在独体字与合体字的书写任务中的作用不同。影响独体字书写错误率的主要因素是字形因素,影响合体字书写错误率的主要因素是字形因素与母语背景因素。我们建议严格区分独体字与合体字教学,在两种类型的汉字教学中充分注意母语背景因素的不同作用。
  (本研究受北京市哲学社会科学规划项目“北京话计量语言学研究”[12WYC032]与北京语言大学校级项目[中央高校基本科研业务专项资金资助]“现代汉语新闻语体计量研究”[12YBG032]资助。)
  注 释:
  ①本文所述的结构类型均指首层结构。
  ②错误率 =(错误频次/使用频次)* 100%。
  ③限于篇幅,表中没有显示框架结构字的数据。
  参考文献:
  [1]朱志平.汉字构形学说与对外汉字教学[J].语言教学与研究,2002,(4).
  [2]崔永华,陈小荷.影响非汉字圈汉语学习者汉字学习因素的分析[A].赵丽明,黄国营.汉字的应用与传播[C].北京:华语教学出版社,
  2000.
  [3]郝美玲,范慧琴.部件特征与结构类型对留学生汉字书写的影响[J].语言教学与研究,2008,(5).
  [4]江新.对外汉语教学的心理学探索[M].北京:教育科学出版社,2007.
  [5]江新.针对西方学习者的汉字教学:认写分流、多认少写[A].顾安达,江新,万业馨.汉字的认知与教学——西方学习者汉字认知国际
  研讨会论文集[C].北京:北京语言大学出版社,2007.
  [6]尤浩杰.笔画数、部件数和拓扑结构类型对非汉字文化圈学习者汉字掌握的影响[J].世界汉语教学,2003,(2).
  [7]黄伟.字形特征对汉字文化圈中高级水平学习者书写汉字的影响[J].世界汉语教学,2012,(1).
  [8]HSK动态作文语料库课题组.“HSK动态作文语料库”说明[Z].http://202.112.195.192/hsk/index.asp,2008.
  [9]邢红兵.现代汉字特征分析与计算研究[M].北京:商务印书馆,2007.
  [10]万业馨.试论汉字认知的内容与途径[A].顾安达,江新,万业馨.汉字的认知与教学——西方学习者汉字认知国际研讨会论文集[C].北
  京:北京语言大学出版社,2007.
  (黄伟 北京 中国传媒大学应用语言学研究所/北京语言大学汉语水平考试中心 100083)
其他文献
摘 要:网络新词的产生、流行和理论阐释一直是词汇研究的热点之一。本文以近年出现的“五毛”为个案,探求其新义来源,描述新义使用开来的网络时代背景及语义的进一步变迁,并运用空位、竞争、模因论等理论来分析它产生、流行的动因。新词的研究,不能只停留在描述上,更需要运用最新的理论来解释,甚至需要创设出新理论。  关键词:网络词语 五毛 流行 动因 模因  一、引言  语言三要素中,最易变动的是词汇。
期刊
摘 要:本文从认知语言学的角度,系统地考察了英汉语言中“耳”的隐喻映射的范围、共性及各个映射背后的原因。研究结果表明,“耳”在英汉两种语言中的隐喻映射大部分是相同的,这反映了英汉两个民族在思维上的同一性。  关键词:耳 隐喻 语料 人体隐喻 映射范围  一、引言  认知语言学认为,我们的概念和意义系统基于感知的体验,而感知的体验又是基于人体的构造。因此,人体是人类认知世界的基础,人
期刊
摘 要:阿里内提出的“词汇自测定方法”值得借鉴,它可以用于建构“汉字起源年代的字测定方法”,弥补国内汉字起源研究方法上的不足,更客观地测定汉字起源年代,形成更科学的汉字观:汉字由其使用者共同创造,历史相当久远,伴随着我国人类进化的整个进程;它不是汉语的附庸,而与汉语同时起源,同步发展,并在渐进发展过程中保持很高的稳定性和延续性。在这种汉字观观照下的“汉字起源年代的字测定方法”在理论上是可能的。  
期刊
摘 要:《汉语大词典》在编纂时坚持“古今兼收,源流并重”的原则,集古今语词之大成。但是,由于时代条件所限,词典中尚有若干疏失。梁萧统编《文选》、陈徐陵编《玉台新咏》保留了许多珍贵的汉语语料,有些内容为《大词典》编纂者所忽略。兹据《文选》《玉台新咏》及相关典籍对《大词典》词条、书证等方面的疏漏加以订正、补充。  关键词:汉语大词典 文选 玉台新咏 词条 例证 订补  《汉语大词典》[1](以下简称《
期刊
摘 要:本文关注媒体中字母词标注的规范性。以《北京晚报》《新民晚报》《羊城晚报》为考察对象,考察了媒体中字母词标注率,媒体中字母词的标注形式。考察数据和文字说明显示,媒体中字母词汉语标注率低,字母词汉语标注形式混乱。两点建议:字母词汉语标注亟需规范;外文原形词的规范应提到议事日程。  关键词:字母词 标注 规范性  一、引言  新京报讯:2012年8月27日,包括中国社会科学院哲学研究所研究员
期刊
摘 要:追寻丹麦现代语言学家叶斯柏森的学术成长经历和治学经验,围绕他对“现代人文科学”“研究”“学会”等概念的阐释,挖掘叶氏学术思想,指出其学术思想对当今中国外语学界仍然极具启示意义。  关键词:求学经历 治学经验 学术实践 学术思想  一、引言  叶斯柏森是丹麦国际级语言学大师,学术研究跨越语言学多个相关领域,一生著作等身。探究叶氏学术成长过程、学术思想及治学风格,对当今中国外语学界仍不失启迪意
期刊
摘 要:作为我国著名散文家、诗人、学者,朱自清凭借其独树一帜的艺术风格,为中国现代散文做出了重要贡献。而他早期的作品《匆匆》更是凭借其朴实无华的文风,清隽沉郁的格调,洗练精悍的语言与秀丽简约的文笔成为中国现代散文的典范。本文选取朱纯深先生译文,通过对《匆匆》中英文两个版本的对比,用实例说明意合与形合现象是如何体现在文本中的,从而加深对英汉两种语言的理解,进一步提高翻译水平与审美水平。  关键词:《
期刊
摘 要:本文主要从语义功能角度,结合“从”与“から”各自的句法功能,探明两者的异同。  关键词:从 から 比较  比较是人类认识事物、研究事物的基本方法之一,也是语言学研究的一种基本方法。近年来,随着改革开放的发展,国际交流越来越频繁,学习日语的中国人和学习汉语的日本人越来越多,日语与汉语之间的对比研究越来越受到重视。虽然日语跟汉语是非亲属语言,但二者存在着密切的关系,具有可比性,可以通过对
期刊
摘 要:庾信作为六朝时期的集大成者,在文学史上有着重要的地位。他通过审美回忆进行艺术创作,语言清新流丽。庾信工于炼字,精于示现,善于对仗,讲求声律和谐,他的审美回忆性创作及其中的修辞手法对唐代诗歌产生了深远影响,具有极高的语言魅力和文学价值。因而,探讨庾信审美回忆性作品中的辞格运用,有着修辞学与文学的双重意义。  关键词:庾信 审美回忆性作品 辞格运用  《四库全书总目》评价庾信:“集六朝之大成,
期刊
摘 要:本文主要从“喻体的选择”“使用比喻的情境分布”以及“与其他修辞手法的融合”三个方面探析苏青小说《结婚十年》中别具一格的比喻艺术。  关键词:苏青 比喻 喻体 修辞手法  宁波籍女作家苏青曾在上世纪40年代的上海文坛风靡一时,她以独特的女性视角书写了动荡的社会环境下女性命运的悲欢际遇,与张爱玲并称为“文坛双璧”。受到沦陷区文化政策的影响,苏青的作品题材往往疏离战争和政治,而取材于自身或周围女
期刊