论文部分内容阅读
摘 要 汉语释义元语言研究起步晚,进展慢,在外向型汉语学习词典编纂中的实践更是不足。文章基于一部外向型汉语学习词典的编纂经验提出:释义元语言意识不仅体现在释义方面,还应体现在配例、辨析等每一个环节;释义元语言不仅包括用词,还应包括用句。文章较为详细地介绍了如何基于这部外向型汉语学习词典提取释义元词,并对提取的释义元词难度和用字难度做了大概分析。最后基于以上认识用案例的形式呈现如何将释义元语言意识落实到具体的词典编写和修改过程的每一个环节,并提出了具体编写建议。
关键词 释义元语言 外向型汉语学习词典 词典编纂
一、 前 言
汉语教学的蓬勃发展使得汉语学习词典及其研究也得到了一定的关注,学界先后推出的汉语学习词典已达50余部,比较有代表性的如《商务馆学汉语词典》(鲁健骥,吕文华2006)、《汉语教与学词典》(施光亨,王绍新2011)、《当代汉语学习词典》(张志毅2020)、《现代汉语常用词用法词典》(李忆民1995)等,但令人遗憾的是,95%左右的汉语学习者没有使用过中国出版的汉语学习词典。(夏立新2009;章宜华,杜焕君2010;杨玉玲,杨艳艳2019)而我国95%的英语学习者选择使用英美国家出版的英语学习词典。这一对比数据不能不令我们深思:为什么我们的汉语学习词典不被“青睐”?如何才能使我们的汉语学习词典摆脱这种“市场大应用少”的尴尬?
通过调查和分析(杨玉玲,杨艳艳2019),我们发现国内汉语学习词典不被“青睐”的原因很多,比如纸本介质不便携带,汉字部首不便查詢,单语释义、没有释义元语言意识,配例过少,义项排列不科学,语法功能提炼不明显等。归根结底,这些问题的出现是因为缺少用户友好性,没有站在用户的角度去研发和编纂汉语学习词典,没有真正摆脱内向型汉语词典的模式。本文仅基于作者研发外向型汉语学习词典JUZI[1]的经验,从释义元语言的角度对外向型汉语学习词典编纂进行初步探讨,以期对此后汉语学习词典编纂有一定的启示,使国内外向型汉语学习词典逐渐摆脱“无外国学生问津”的尴尬局面。
一、 汉语释义元语言研究和应用现状
词典的基本作用是使用户理解词义,而学习型词典除了理解词义外,还应使用户学会词语的用法。无论是何种需求,其实现的前提都是用户“看得懂”。若“看不懂”,即词典呈现给用户的词语信息是不可理解的,无论释义多么精准,例句多么丰富考究,都形同虚设。尤其是对一部外向型学习词典而言,在保证内容准确的基础上,“看得懂”是一个最基本的要求。最有代表性的英语五大学习词典之所以获得巨大成功,原因是多方面的,其中最重要的因素之一是严格控制释义用词数量,基于有限的释义元词来编写。根据各词典说明,五大英语学习词典释义元词量如下:
可以看出,国外“在当代词典编纂实践中,使用定量词汇释义是一种主导趋势”(安华林2005)。相比之下,汉语词典编写却很少考虑元语言问题,如《现代汉语词典》第3版收词6万余条,而所用释义性词语达3.6万多个(安华林,曲维光2004)。汉语释义元语言计量研究起步晚,进展慢,仅有苏新春(2005)提取的4000多个释义元词,安华林(2005)提取的2787个释义元词。而基于随机释义的内向型《现代汉语词典》释义提取的释义元词是否适用于外向型汉语学习词典,这是值得怀疑的,更重要的是,这些研究基本上仍停留在理论层面,鲜少见到将其真正运用于外向型汉语学习词典的编写过程[2]。根据调查(杨玉玲,杨艳艳2019),汉语二语学习者之所以对中国出版的汉语学习词典望而却步的一个重要原因是“解释、例句太难,看不懂”。为了考察已有外向型汉语学习词典的释义元语言情况,我们以《商务馆学汉语词典》(以下简称《商务馆》)为例,采取抽样调查的方式对其1500条被释词的释义进行了定量统计,结果如下:该词典共使用3070个释义元词,所有释义文本共计13993词,文本用词等级分布如表2所示。
从我们对JUZI释义元词统计中发现的释义元词增幅规律(见下文)来看,《商务馆》全部释义元词总量可能控制在6000词左右,比《现代汉语词典》第3版3.6万释义元词少很多,这自然是前进了一大步,释义语言也简单了很多,但总的来看,仍有16.38%的超纲词。为了考察其整体释义难度,我们利用“汉语阅读分级指难针”[3]进行了统计。结果如下:
1500词的释义文本难度平均为2.92/4,处于中等四级。为了更加直观地呈现,我们取第一次的统计结果[4]进行分析。
统计结果显示,本次释义文本难度为3.14,处于高等五级。这一难度对初级阶段的汉语学习者而言,“看不懂”是毋庸置疑的。当然,我们不能因此“责怪”《商务馆》的编者,因为其设定的用户对象就是中级水平以上的汉语学习者。事实上,若在编写过程中有释义元语言意识,或在编写之后进行了定量统计并修改,很多释义难度是可以降低的。如:
无论是从用户反馈还是《商务馆》释义用词的抽样调查,都可以看出外向型汉语学习词典在释义元语言意识和实践方面均需加强。
关于汉语释义元语言的研究,前贤多关注释义元词的研究,仅有翁晓玲(2011)、武建宇、宋文辉(2009)提出释义元语言不仅包括释义词汇的研究,还应包括释义句法、例句的研究,此观点非常具有启发意义。对于外向型学习词典而言,不仅要“看得懂”释义,还要“看得懂”配例和辨析,即词典释义元语言不仅体现在释义用词的限制方面,还体现在释义句型的选择和控制方面;除了释义中需注意用词和用句,配例和辨析也均需注意用词和用句。无论从解码还是编码的角度来看,学习词典的释义、配例、句法信息、用法说明和易混淆词辨析等都应是整个释义元语言系统的一部分,即在整个学习型词典的编写过程中都应有元语言意识,并将之贯穿落实到每一个环节。但非常遗憾,这些观点目前仅是理论建构,尚需基于大规模词典编写去实现并验证。JUZI的研发和编写正是这方面的一个尝试。 二、 JUZI释义元词的提取、分析和应用
(一) JUZI释义元词的提取和分析
为了考察词典编者在释义元语言意识的监控下编写的汉语学习词典的用词情况,我们统计并研究了历时七年编写完成的JUZI释义语言。研究大致分为三步:
第一步,组织教学经验丰富的一线教师遵循“把编词典当做上课”“把词典当成学生”“释义语言尽量简单但要准确”的原则,完成前5000词释义;
第二步,对已完成的5000词释义元词进行提取和优化,初步得出释义元词表;
第三步,将该释义元词表用于此后词条的编写,以验证和补充释义元词表。
从统计中发现释义元词的规律如下:
第一,随着被释词数量的增加,释义元词也随之增加,但增幅变缓,符合“边际效用递减规律”。据此预计当被释词数量到达6500条后,同比新增释义元词的数量将为个位数,释义元词总数达3100个左右。据此初步统计,1万条被释词的释义元词应该可以控制在3400个左右(已统计证实,尚未优化分析),这个数目符合我们日常使用的词汇量,也与权威英语学习词典的释义元词数量相仿。
第二,被释词数量达2300条时,释义元词和被释词数量持平,此后增幅递减,被释词达到7000条时,释义元词数量基本稳定。
第三,高频词数量不多,但释义功能强大,占释义元词31.6%的高频词和次高频词却占释义文本的90.16%:低频词数量多,但释义功能很弱,占释义元词68.42%的1频词和2频词仅占释义文本的9.84%。因此,可將高频词和次高频词归为释义常用词。
为了发现这2920个释义元词的难度分布,我们根据《汉语水平词汇和汉字等级大纲》(1992,以下简称《大纲》),对2920个释义元词进行了难度等级标注和统计。结果如图2所示:
根据图2的统计数据,可以发现:释义元词在《大纲》中甲级词和乙级词共占57.5%,丙级词和丁级词共占30.75%,以此大纲为参照对象,释义元词以初级词汇为主。11.75%的超纲词汇主要是仅出现一次的专有名词(如“耶稣”“意大利”“江苏”等)、释义专用词汇(如“泛称”“简称”“尊称”等)。除此之外,《大纲》存在常用词未收录的现象,如“造成”“成年”“夸张”“冰箱”“果汁”等,这类词不可避免地出现在释义语言中,显然是《大纲》的遗漏。为了考察这11.75%的超纲词是否影响了释义文本难度,我们对整个释义文本71026个词的难度等级进行了分析。结果如图3所示:
根据图3,可以发现,释义文本中有64.70%为甲级词,23.78%为乙级词,甲级词和乙级词共占88.48%,初级词汇占绝大部分。丙级词和丁级词比重不足10%。超纲词因多为使用一次的罕频词,在整个释义文本中仅占1.54%,显然不会影响整个释义的难度,适用于广大汉语学习者。
为了全面了解释义元词的难度,不仅要考察释义用词的总量和难度分布,还需考察其所用汉字的总量和难度分布。为此我们对2920个释义元词用字和《汉语国际教育用音节汉字词汇等级划分(汉字表)》(2010)进行了对比。通过统计,我们发现,2920个释义元词共使用汉字1609个,其中和3000常用字表重合1601个,重合率99.5%。不在3000常用字表的8个汉字是在整个释义文本中只出现一次的“耶、稣、氢、罂、粟、锥、棕、拇”。对这1601个汉字的难度分布统计结果如图4所示:
在1601个所用汉字中,868个为一级汉字,占54%,582个为二级汉字,占36%,一、二级汉字总数为1450个,占90%。所以无论是从其与3000常用字表的重合率还是从其等级分布,都可以看出2920个释义元词用字是易于理解和掌握的。
(二) 释义元词的实现及编写案例
释义元词需具备几个特点,如有限性、基础性、非随意性、工具性等,这些原则的提出固然重要,而如何落实在学习型词典的编写过程中更为重要。为了确保控制释义用词的难度和数量,根据我们在JUZI的编写和修改过程中的体验,提出以下几点具体建议:
1. 遵循释义用词难度低于被释词的原则,尽量选择难度低于被释词的词语。如:
救(乙级) 援助(丙级)使脱离(乙级)灾难(丙级)或危险(甲级)。(《现代汉语词典》第7版,以下简称《现汉》)
救(乙级) 帮助使脱离危险、灾难(丙级)。(《商务馆》)
救(乙级) 援助(丙级);帮助。(《当代汉语学习词典》,以下简称《当代》)
救 某人或者某物非常危险的时候,帮助他,使他不再有危险。(JUZI)
堆(乙级) 堆积(丙级)。(《现汉》)
堆(乙级) 堆积(丙级)。(《商务馆》)
堆(乙级) 堆积(丙级)。(《当代》)
堆 把东西从下到上一点一点地放在一起,一般会形成一定的高度。(JUZI)
显然以上几部已有词典都是用难词释易词,为无效释义,在外向型学习词典里应努力避免。事实上这种释义现象在汉语词典里比比皆是,如用“堵塞、堆积”释“堵、堆”。
2. 使用高频常用词语,避免使用超纲词,在词典内部形成闭环。如:
大量(乙级) ② 气量(超纲)大,能容忍(丁级)。(《现汉》)
大量(乙级) ② 心胸(超纲)宽广(丁级),能容人(超纲)。(《当代》)
大量 形容一个人在别人做错事情的时候不生气, 经常原谅别人。(JUZI)
如在查询某词过程中还需多次查询释义用词,甚至因为超纲而查不到,这种学习体验可想而知。
3. 使用语体色彩不太鲜明的中性词语,避免使用过于书面化或口语的词语。如:
英俊 容貌俊秀又有精神。(《现汉》)
英俊 相貌清秀好看而有精神。(《当代》) 英俊 (男性,多指男青年)长得好看而且有精神。(JUZI)
过于书面化的词语难度自然高,可理解性差。再如书面词语“患者、出售、购买、场所、悬挂”等在外向型汉语词典释义时宜换成“病人、卖东西、买东西、地方、挂”等。
惦记 (对人或事物)心里老想着,放不下心。(《现汉》)
惦记 因为想念、担心或期待而心里老想着。(《当代》)
惦记 因为想念、担心或者期待,心里总是想着(某人、某物或者某事)。(JUZI)
口语色彩较重的词语“老”适宜换成“总是” 。
4. 采用学习型释义模式,避免百科式释义,尽量减少专业术语。如:
水 最简单的氢氧化合物,化学式是H2O。无色、无味、无臭的液体,在标准大气压(101.325千帕)下,冰点0℃,沸点100℃, 4℃时密度最大,为1克/毫升。(《现汉》)
水 人类必需的最普通的一种液体,没有颜色、气味、味道。(JUZI )
这是一杯水。
半导体 导电能力介于导体和绝缘体之间的物质,如锗、硅、砷和某些化合物。这种物质具有单向导电等特性。(《现汉》)
半导体 一种特殊的物质,只能向一个方向导电。(JUZI )
再如已有学习词典中常用的“草本、木本、食用、家禽”等百科性释义词语都应避免使用。
5. 释义元词表应避免出现同义近义词,选择使用高频简单的词语。如下列词语在释义元词表中共现,可选择后者:
可——可以,无——没有,或——或者,较——比较,应——应该
但——但是,虽——虽然,已——已经, 曾——曾经, 时——的时候
寒冷——冷,书籍——书,询问——问,安装——装
有时——有时候,不便——不方便,不满——不满意
前者——前面的,高处——高的地方,是否——是不是
如何——怎么样,长期——长时间,如——如果
食用——吃,受益者——得到好处的人。
6. 多使用图片、视频等媒体辅助释义。如:
拔 用力往外拉。一般是从地里或者是从固定的地方把某个东西拉出来。(JUZI)
(动图不停地拔草)它正在拔草。
芭蕾舞 一种舞蹈形式。起源于欧洲,女演员一般用脚尖跳舞。(JUZI)
他们在跳芭蕾舞。
7. 采用例举释义时应跳出内向型辞书的思维框架。如:
黑 像煤或墨的颜色。(《现汉》)
黑 颜色像煤或墨一样。(《当代》)
黑 像煤那样的颜色。(《商务馆》)
一种颜色。像这只猫的颜色。(JUZI)
对中国读者来说“煤、墨”也许是具体可感,可以作为典型例证进入释义,但对需要查阅“黑”的汉语二语学习者来说,是不可感知的,不如用一个更加直观的图片实现快捷释义。再如“酸”的释义,按照中国人的思维习惯,“酸”的典型代表自然是“醋”,但对汉语二语学习者来说,“醋”这个汉字很可能超出该水平读者的认知,而且“醋”也不易呈现。在编写外向型汉语学习词典的过程中应跳出内向型词典的思维定式,站在外文化的角度去选择作为例子的典型代表。对比如下:
酸 像醋的气味或味道。(《现汉》)
酸 气味和味道像醋一样。(《当代》)
酸 像醋一样的味道。(《商务馆》)
酸 气味或者味道像柠檬一样。(JUZI )
通过以上释义案例,我们会发现外向型学习词典释义和内向型词典释义具有较大区别。总体来说,释义用词难度低,释义长度长,有的释义稍显啰唆,有的地方用内向型词典的标准去判断,甚至不够精准。对此郝瑜鑫(2019)已有论述:“供本族人查阅的语文词典以促进语言规范化,推广民族共同语为主要目标,因此在释义上追求精细性、科学性、经济性、系统性等原则,释义语言的使用范围不需要严格限制。汉语学习词典的学习者是缺乏目的语的外国人,在释义上应以易懂性为最重要的目标,即让学习者能够看得懂词条内容,获得词条信息,从而促进语言的习得。上述适用于本族人词典的原则并不是主要的考量标准,学习词典很多时候会采用迂回但易懂的方式释义,甚至以牺牲部分准确性、经济性为代价。”这种观点是非常中肯的,当精准和易读之间需要平衡时,在外向型学习词典编纂中有时需放弃精准,而选择可懂会用,如上文的“援助”换成“帮助”就是一个例子。非常遗憾的是,目前很多学者包括外向型汉语学习词典的编者们对此并没有深刻的认识,自然就很难编出真正意义上的外向型汉语学习词典。
三、 元语言意识监控下的释义句型研究及编写案例
如前所言,对于一部外向型学习词典而言,要想使释义浅显易懂,编纂和修改过程除了控制释义元词的数量和难度之外,还应注意释义句型的数量和难度,即在释义过程中尽量使用简单有限的句型,使释义更加自然流畅,通俗易懂。目前关于释义句型的研究较为零散,尚未建立完整的释义元句法体系。JUZI团队目前对释义句型也尚未进入定量统计阶段,本文仅基于对JUZI释义句型的观察和编写经验,提出以下4条操作性建议:
第一,句子尽量简短,降低分句的长度,减少较长的修饰语。当修饰语较长时,可将其改为分句,或删除部分次要的修饰成分。如:
詞典 收集词汇加以解释供人检查参考的工具书。(《现汉》)
把收集的词语按一定的次序排列并加以解释供人检查参考的工具书。(《现代汉语学习词典》)
把词语按一定的顺序排列起来并加以解释的工具书。(《商务馆》)
收集词汇加以解释,供人检查参考的工具书。(《当代》)
词典 一种工具书。在这种工具书里,把词语按照一定的顺序排列并进行解释。(JUZI) 汉语中词和词的界限不是那么显而易见,因此在词典释义时,为了减少学习者出现“分词”困难的现象,应尽量减少长句的使用,避免修饰语过长。以上两个释义虽然修改前后意思差不多,但修改前包含多项定语,句子结构内部比较复杂,特别是“词典”的释义不仅包含“把”字句,还包括“把”字句做定语,多个连动结构做定语等情况,增加了二语学习者的理解难度。我们在JUZI释义中采取化整为零,化繁为简,化规范典雅为通俗易懂的措施,先在读者心理词典确定范围,然后给出限制条件,辅以图片配例达到准确快速释义的目的。
第二,使用现代汉语典型的句法结构。如:
樱花 落叶乔木,叶子椭圆形,花白色或粉红色,果实球形,黑色。供观赏。 (《现汉》)
樱花 这种作为观赏的树,春天开花,花是白色或者粉色的。(JUZI)
这棵樱花已经有100年了。
以上《现汉》释义虽然准确、简短,但除了用词违反上文谈到的释义元语言之外,其包含的句法也不是典型的现代汉语句法,如“花白色”,其完整的形式应该为“花是白色的”,此种释义句法适用于母语者,可增加词典的书面、典雅色彩,同时可减少词典篇幅,但对于外向型学习词典却不合适,大多数汉语学习者通过这种释义很难准确理解词义。为了使释义语言具有可理解性,不仅应减少专业百科性词语,还需将释义句型改成现代汉语典型句型,同时辅以图片释义,从而弥补释义的不足。
第三,以主动语态为主进行释义,尽量避免被动语态、双重否定句等。如:
把柄 比喻可以被人用来进行要挟或攻击的过失或错误等。(《现汉)
把柄 原来的意思是把手。比喻自己的错误或者问题,别人知道后可以用它来威胁、控制自己。(JUZI)
垫 用沙、土等铺、盖在地面上,使地平整、加高或使上面的液体被覆盖。(《当代》)
垫 用土、沙子等类似的东西铺、盖在地面上,使地面变平、变高或者盖上地面上的液体。(JUZI)
对学生来说“被”字句,“进行V”叠加之后做定语等不易理解。
第四,尽量采用中性语体句式,避免使用过于书面化或过于口语化的句式。如:
碟子 盛菜蔬或调味品的器皿,比盘子小,底平而浅。(《现汉》)
碟子 盛菜蔬或调味品的器皿,比盘子小,底平而浅。(《当代》)
碟子 6个碟子。
这种吃饭的用具。样子和盘子一样,但比盘子小而且浅。 (JUZI)
《现汉》和《当代》释义中不仅使用非常用词“菜蔬”,而且“平而浅”这种结构对二语学习者来说过于书面,宜换成中性表述方式。
四、 元语言意识监控下的配例研究及编写案例
(一) JUZI配例元语言抽样考察
和释义一样,外向型学习词典配例用词也应控制在一定的范围内,以使用者看得懂为前提,否则配例就形同虚设。曾丹(2015)认为“例子中的词语应尽量控制在《新HSK大纲》的词汇范围之内,少用或不用超纲词汇”。我们认为配例确实应遵循元语言原则,但对于一部外向型学习词典来说,其配例语言不能只考虑用词的难度,还应考虑以下几个因素:
第一,配例用词总量:配例用词应限制在一定的范围内,但会远远大于释义元词,即要有一定的丰富性,不应一味追求难度低而忽略丰富性;
第二,配例用词难度:固然要考察一部词典所有配例用词的难度,但更要考察某个具体词语的配例用词是否高于该被释词;
第三,配例用句难度。
不少学者已指出汉语学习词典在配例方面存在的问题,如刘川平(2006)“用例内容和语言没有完全跳出面向国人的词典的路子,没有充分考虑读者对象的特殊需要”。为了考察JUZI配例用词难度和丰富性,我们对其配例进行了定量考察。因配例文本很大,大规模配例情况的定量统计尚未完成,我们仅抽取A字母段所有词语的配例进行了抽样统计分析。统计结果如图5所示:
A字母段配例共用词8580个,其中甲级词6236个,占比72%,乙级词972个,占比11%,丙级和丁级词分别为398个和451个,占比5%左右,超纲词623个,占比7%。但根据对超纲词的单独考察,我们发现很多所谓的超纲词并非真的超纲词。主要是由以下几种情况造成的:
第一,自动分词不准确,如:家家、试试、第一、回家、挨到、见到、坐在、找到、挨门挨户、周一、周日、暗下(决心)、来安、打凹、一个、两本等是因为分词软件造成的“假超纲”。
第二,配例中使用的专有名词,如:张大明、小李、老王、罗密欧、朱丽叶、中国、美国、法国、北京、上海、纽约、巴黎、东京、故宫、长城、四川、西藏、雅典、张家口等。这些专有名词在配例里一般也不会增加难度,只是因为大纲没有收录,造成“貌似超纲”。这些所谓的专有名词如果为了降低配例难度是可以换成“他”或者大纲收录的专有名词的,但我们认为配例应该具有丰富性,让不同地区的学生都能看到自己身边的地名,比所有例句都是“北京”要好很多。
第三,大纲遗漏的高频常用词,如父母、超市、绿色、红色、吃饭、造成、车子、大雪、手机、钱包等,现在使用频率非常高,但因为大纲陈旧没有收录,造成“貌似超纲”。
第四,真超此纲但不超彼纲,如爱国主义、按部就班、安居乐业、奥运会、按摩、傲慢、爱慕、安宁、熬夜等,都是词典的词目词,配例必然会高频出现。我们词典收录的总词表是三个大纲合成的涵盖面最广的并集,而判断文本難度的根据只是旧版HSK大纲,难免出现“超此大纲,实则在彼大纲”的现象。
通过上面的分析,我们可以看出,表面上看有7%的超纲词,实际上如果把上述所谓的假性超纲词剔除,根据我们大致排查,真正超纲词为200个左右,占比不足3%,这样的难度是不影响阅读理解的。整体来看,JUZI配例用词比释义用词丰富,数量更多,实际难度不高。目前只是小规模抽样统计,可能还不足以过早对JUZI配例难度下结论,最终结果有待对词典配例大规模统计结果。 (二) 外向型汉语学习词典配例编写建议及案例
为了在丰富性的前提下降低配例难度,在具体编写过程中应注意以下几点:
1. 配例尽量简单,遵循例句用词低于被释词的原则,但同时也应兼顾配例用词的丰富性,如一个5级被释词,其配例用词可以是用1—5级的词汇,不能只用简单的1、 2级词汇,也不能使用6级的词汇。对比如下:
爸爸(甲级) 爸爸,你偏心眼儿(超纲)。(《当代》)
爸爸(甲级) 爸爸,我们去打篮球吧。(JUZI)
办法(甲級) 粉碎(丙级)谣言(丙级)最好的办法是用事实(乙级)来说话。(《当代》)
办法(甲级) 学好汉语最好的办法是多说多看。(JUZI)
2. 配例特别是排在前面的配例尽量要有帮助读者解码的语境,但在保证语境完整的前提下,配例尽量不包含过多的修饰语。如:
巴不得 我巴不得能休几天假。(《当代》)
巴不得 A:我去给你打工行吗?
B:我巴不得你马上就能来,我一个人实在干不完。(JUZI)
没有语境是很难真正理解“巴不得”的使用条件的,但并非语境越多越好,如对“八”而言,《当代》的配例显然有点画蛇添足:
八 宿舍有四张高低床,可以住八个人。(《当代》)
八 八根香蕉。(JUZI)
3. 充分利用语料库,但不可直接照搬,必须经过编者的选择和改编。语料库提供丰富的语境,编者优化保证用词难度,充分利用人机互助人机结合。如:
帮忙 诸葛亮对他说:“三天之内要造十万支箭,必须请你帮忙。”(CTC语料库)[5]
修改为:她说:“时间太紧张,我一个人做不完,请你帮忙。”(JUZI)
帮忙 他最好的朋友找他帮忙,倒被他拒绝了。(CTC)
修改为:他最好的朋友找他帮忙,他虽然很忙,但还是愉快地答应了。(JUZI)
4. 使用和被释词难度相应的句型,避免过难的句型。如:
爸爸 她被爸爸批评了一顿。(《当代》)
爸爸 今天是我爸爸的生日。 (JUZI )
“被”字句的难度显然高于“爸爸”,不应在“爸爸”配例中出现。
5. 配例中尽量少用没有语境的俗语歇后语等。如:
买 一寸光阴一寸金,寸金难买寸光阴。(《当代》)
买 家里没有水果了,我去买一点水果。(JUZI)
6. 为了保证配例的真实性和可理解性可辅以图片或视频。如:
发达 袋鼠的前肢不太发达,后肢很发达。(JUZI)
五、 结 语
通过上文的分析可以知道,若想提高外向型汉语学习词典的可读性,在词典编写和修改过程中都应贯穿释义元语言意识;释义元语言意识不仅体现在释义用词方面,还体现在释义用句方面;不仅体现在释义中,还应体现在配例和辨析等整个环节词典编写环节中;不仅体现在编写过程中,还应体现在修改过程中;不仅要在整部词典编写过程中控制总的释义用词数量和用句的难度,在具体每个词语的编纂过程中都应尽量做到释义用词用句低于被释词的难度等级。有元语言意识容易,但落实难:不仅要有元语言意识,还要对词汇难度有基本的判断,这就要求最好是有丰富汉语教学经验的老师参编,方可真正体现外向型学习词典的语言特点。最好的编写模式是由教学经验丰富的汉语教师参与,由专家进行各种知识性把关。语料库等计算机技术至关重要,可以加快进度,节省大量时间,但单纯依赖技术绝对编写不出好词典。教学经验固然重要,但定量科学统计不可缺少。“看得懂”是一部外向型学习词典的基本要求,除此之外,还应让用户看得高兴,看得“爱不释手”,此问题我们将另文讨论。
附 注
[1]JUZI为30余位教学经验丰富的汉语一线教师历时7年参编完成的一部融媒汉语学习词典App,全典700万字,2万张图片。正进行技术生成。
[2]2020年由商务印书馆出版的《当代汉语学习词典》应该是这方面的一个尝试。
[3]“汉语阅读分级指难针”(languagedata.net/editor)为金檀、陆小飞、林筠、李百川共同主持研发的阅读文本的难度定级与智能改编系统。
[4]“汉语阅读分级指难针”每次仅能统计2000字,故需分多次统计计算平均值。
[5]“CTC语料库”即北京师范大学中文信息处理研究所“汉语国际教育动态语料库”(Corpus of Teaching Chinese as Second Language)。
参考文献
1. 安华林.现代汉语释义基元词研究.北京: 中国社会科学出版社,2005.
2. 安华林,曲维光.《现代汉语词典》释义性词语的统计与分级.语言文字应用,2004(1).
3. 国家对外汉语教学领导小组办公室汉语水平考试部.汉语水平词汇与汉字等级大纲.北京: 北京语言学院出版社,1992.
4. 郝瑜鑫.定量研究与汉语学习词典编纂理念的创新.云南师范大学学报,2019(5).
5. 霍恩比.牛津高阶英汉双解词典(第8版).北京: 商务印书馆,2014.
6. 蔡永强.外向型汉语学习词典的释义用词.辞书研究,2018(4).
7. 李尔钢.建立高质量的释义元语言.辞书研究,2007(1).
8. 李忆民主编.现代汉语常用词用法词典.北京: 北京语言学院出版社,1995.
9. 李智初.对外汉语学习型词典释义的优化.辞书研究,2012(6).
10. 刘川平.对外汉语学习词典用例的一般原则.辞书研究,2006(4).
11. 鲁健骥,吕文华主编.商务馆学汉语词典.北京: 商务印书馆,2006.
12. 施光亨,王绍新.汉语教与学词典.北京: 商务印书馆,2011.
13. 苏新春.汉语释义元语言研究.上海: 上海教育出版社,2005.
14. 孙全洲主编.现代汉语学习词典.上海: 上海外语教育出版社,1995.
15. 翁晓玲.基于元语言的对外汉语学习词典释义模式研究——以《商务馆学汉语词典》为例.华东师范大学博士学位论文,2011.
16. 武建宇,宋文辉.辞书元语言的建构原则.辞书研究,2009(4).
17. 夏立新.对外汉语学习词典的出版和使用者调查研究.出版科学,2009(1).
18. 杨玉玲,杨艳艳.汉语学习词典调查分析及编写设想.现代语文,2019(2).
19. 曾丹.论对外汉语多媒体学习词典的释义和用例原则.语文学刊,2015(1).
20. 章宜华,杜焕君.留学生对汉语学习词典释义方法和表述形式的需求之探讨.华文教学与研究,2010(3).
21. 章宜华.对外汉语学习词典释义问题探讨——国内外二语学习词典的对比研究.世界汉语教学,2011(1).
22. 张志毅主编.当代汉语学习词典.北京: 商务印书馆,2020.
23. 中国社会科学院语言研究所词典编辑室.现代汉语词典(第3、 7版).北京: 商务印书馆,1996, 2016.
24. 中华人民共和国教育部,国家语言文字工作委员会.汉语国际教育用音节汉字词汇等级划分(汉字表),2010.
(北京语言大学人文学部/汉语国际教育研究院 北京 100083)
(责任编辑 刘 博)
关键词 释义元语言 外向型汉语学习词典 词典编纂
一、 前 言
汉语教学的蓬勃发展使得汉语学习词典及其研究也得到了一定的关注,学界先后推出的汉语学习词典已达50余部,比较有代表性的如《商务馆学汉语词典》(鲁健骥,吕文华2006)、《汉语教与学词典》(施光亨,王绍新2011)、《当代汉语学习词典》(张志毅2020)、《现代汉语常用词用法词典》(李忆民1995)等,但令人遗憾的是,95%左右的汉语学习者没有使用过中国出版的汉语学习词典。(夏立新2009;章宜华,杜焕君2010;杨玉玲,杨艳艳2019)而我国95%的英语学习者选择使用英美国家出版的英语学习词典。这一对比数据不能不令我们深思:为什么我们的汉语学习词典不被“青睐”?如何才能使我们的汉语学习词典摆脱这种“市场大应用少”的尴尬?
通过调查和分析(杨玉玲,杨艳艳2019),我们发现国内汉语学习词典不被“青睐”的原因很多,比如纸本介质不便携带,汉字部首不便查詢,单语释义、没有释义元语言意识,配例过少,义项排列不科学,语法功能提炼不明显等。归根结底,这些问题的出现是因为缺少用户友好性,没有站在用户的角度去研发和编纂汉语学习词典,没有真正摆脱内向型汉语词典的模式。本文仅基于作者研发外向型汉语学习词典JUZI[1]的经验,从释义元语言的角度对外向型汉语学习词典编纂进行初步探讨,以期对此后汉语学习词典编纂有一定的启示,使国内外向型汉语学习词典逐渐摆脱“无外国学生问津”的尴尬局面。
一、 汉语释义元语言研究和应用现状
词典的基本作用是使用户理解词义,而学习型词典除了理解词义外,还应使用户学会词语的用法。无论是何种需求,其实现的前提都是用户“看得懂”。若“看不懂”,即词典呈现给用户的词语信息是不可理解的,无论释义多么精准,例句多么丰富考究,都形同虚设。尤其是对一部外向型学习词典而言,在保证内容准确的基础上,“看得懂”是一个最基本的要求。最有代表性的英语五大学习词典之所以获得巨大成功,原因是多方面的,其中最重要的因素之一是严格控制释义用词数量,基于有限的释义元词来编写。根据各词典说明,五大英语学习词典释义元词量如下:
可以看出,国外“在当代词典编纂实践中,使用定量词汇释义是一种主导趋势”(安华林2005)。相比之下,汉语词典编写却很少考虑元语言问题,如《现代汉语词典》第3版收词6万余条,而所用释义性词语达3.6万多个(安华林,曲维光2004)。汉语释义元语言计量研究起步晚,进展慢,仅有苏新春(2005)提取的4000多个释义元词,安华林(2005)提取的2787个释义元词。而基于随机释义的内向型《现代汉语词典》释义提取的释义元词是否适用于外向型汉语学习词典,这是值得怀疑的,更重要的是,这些研究基本上仍停留在理论层面,鲜少见到将其真正运用于外向型汉语学习词典的编写过程[2]。根据调查(杨玉玲,杨艳艳2019),汉语二语学习者之所以对中国出版的汉语学习词典望而却步的一个重要原因是“解释、例句太难,看不懂”。为了考察已有外向型汉语学习词典的释义元语言情况,我们以《商务馆学汉语词典》(以下简称《商务馆》)为例,采取抽样调查的方式对其1500条被释词的释义进行了定量统计,结果如下:该词典共使用3070个释义元词,所有释义文本共计13993词,文本用词等级分布如表2所示。
从我们对JUZI释义元词统计中发现的释义元词增幅规律(见下文)来看,《商务馆》全部释义元词总量可能控制在6000词左右,比《现代汉语词典》第3版3.6万释义元词少很多,这自然是前进了一大步,释义语言也简单了很多,但总的来看,仍有16.38%的超纲词。为了考察其整体释义难度,我们利用“汉语阅读分级指难针”[3]进行了统计。结果如下:
1500词的释义文本难度平均为2.92/4,处于中等四级。为了更加直观地呈现,我们取第一次的统计结果[4]进行分析。
统计结果显示,本次释义文本难度为3.14,处于高等五级。这一难度对初级阶段的汉语学习者而言,“看不懂”是毋庸置疑的。当然,我们不能因此“责怪”《商务馆》的编者,因为其设定的用户对象就是中级水平以上的汉语学习者。事实上,若在编写过程中有释义元语言意识,或在编写之后进行了定量统计并修改,很多释义难度是可以降低的。如:
无论是从用户反馈还是《商务馆》释义用词的抽样调查,都可以看出外向型汉语学习词典在释义元语言意识和实践方面均需加强。
关于汉语释义元语言的研究,前贤多关注释义元词的研究,仅有翁晓玲(2011)、武建宇、宋文辉(2009)提出释义元语言不仅包括释义词汇的研究,还应包括释义句法、例句的研究,此观点非常具有启发意义。对于外向型学习词典而言,不仅要“看得懂”释义,还要“看得懂”配例和辨析,即词典释义元语言不仅体现在释义用词的限制方面,还体现在释义句型的选择和控制方面;除了释义中需注意用词和用句,配例和辨析也均需注意用词和用句。无论从解码还是编码的角度来看,学习词典的释义、配例、句法信息、用法说明和易混淆词辨析等都应是整个释义元语言系统的一部分,即在整个学习型词典的编写过程中都应有元语言意识,并将之贯穿落实到每一个环节。但非常遗憾,这些观点目前仅是理论建构,尚需基于大规模词典编写去实现并验证。JUZI的研发和编写正是这方面的一个尝试。 二、 JUZI释义元词的提取、分析和应用
(一) JUZI释义元词的提取和分析
为了考察词典编者在释义元语言意识的监控下编写的汉语学习词典的用词情况,我们统计并研究了历时七年编写完成的JUZI释义语言。研究大致分为三步:
第一步,组织教学经验丰富的一线教师遵循“把编词典当做上课”“把词典当成学生”“释义语言尽量简单但要准确”的原则,完成前5000词释义;
第二步,对已完成的5000词释义元词进行提取和优化,初步得出释义元词表;
第三步,将该释义元词表用于此后词条的编写,以验证和补充释义元词表。
从统计中发现释义元词的规律如下:
第一,随着被释词数量的增加,释义元词也随之增加,但增幅变缓,符合“边际效用递减规律”。据此预计当被释词数量到达6500条后,同比新增释义元词的数量将为个位数,释义元词总数达3100个左右。据此初步统计,1万条被释词的释义元词应该可以控制在3400个左右(已统计证实,尚未优化分析),这个数目符合我们日常使用的词汇量,也与权威英语学习词典的释义元词数量相仿。
第二,被释词数量达2300条时,释义元词和被释词数量持平,此后增幅递减,被释词达到7000条时,释义元词数量基本稳定。
第三,高频词数量不多,但释义功能强大,占释义元词31.6%的高频词和次高频词却占释义文本的90.16%:低频词数量多,但释义功能很弱,占释义元词68.42%的1频词和2频词仅占释义文本的9.84%。因此,可將高频词和次高频词归为释义常用词。
为了发现这2920个释义元词的难度分布,我们根据《汉语水平词汇和汉字等级大纲》(1992,以下简称《大纲》),对2920个释义元词进行了难度等级标注和统计。结果如图2所示:
根据图2的统计数据,可以发现:释义元词在《大纲》中甲级词和乙级词共占57.5%,丙级词和丁级词共占30.75%,以此大纲为参照对象,释义元词以初级词汇为主。11.75%的超纲词汇主要是仅出现一次的专有名词(如“耶稣”“意大利”“江苏”等)、释义专用词汇(如“泛称”“简称”“尊称”等)。除此之外,《大纲》存在常用词未收录的现象,如“造成”“成年”“夸张”“冰箱”“果汁”等,这类词不可避免地出现在释义语言中,显然是《大纲》的遗漏。为了考察这11.75%的超纲词是否影响了释义文本难度,我们对整个释义文本71026个词的难度等级进行了分析。结果如图3所示:
根据图3,可以发现,释义文本中有64.70%为甲级词,23.78%为乙级词,甲级词和乙级词共占88.48%,初级词汇占绝大部分。丙级词和丁级词比重不足10%。超纲词因多为使用一次的罕频词,在整个释义文本中仅占1.54%,显然不会影响整个释义的难度,适用于广大汉语学习者。
为了全面了解释义元词的难度,不仅要考察释义用词的总量和难度分布,还需考察其所用汉字的总量和难度分布。为此我们对2920个释义元词用字和《汉语国际教育用音节汉字词汇等级划分(汉字表)》(2010)进行了对比。通过统计,我们发现,2920个释义元词共使用汉字1609个,其中和3000常用字表重合1601个,重合率99.5%。不在3000常用字表的8个汉字是在整个释义文本中只出现一次的“耶、稣、氢、罂、粟、锥、棕、拇”。对这1601个汉字的难度分布统计结果如图4所示:
在1601个所用汉字中,868个为一级汉字,占54%,582个为二级汉字,占36%,一、二级汉字总数为1450个,占90%。所以无论是从其与3000常用字表的重合率还是从其等级分布,都可以看出2920个释义元词用字是易于理解和掌握的。
(二) 释义元词的实现及编写案例
释义元词需具备几个特点,如有限性、基础性、非随意性、工具性等,这些原则的提出固然重要,而如何落实在学习型词典的编写过程中更为重要。为了确保控制释义用词的难度和数量,根据我们在JUZI的编写和修改过程中的体验,提出以下几点具体建议:
1. 遵循释义用词难度低于被释词的原则,尽量选择难度低于被释词的词语。如:
救(乙级) 援助(丙级)使脱离(乙级)灾难(丙级)或危险(甲级)。(《现代汉语词典》第7版,以下简称《现汉》)
救(乙级) 帮助使脱离危险、灾难(丙级)。(《商务馆》)
救(乙级) 援助(丙级);帮助。(《当代汉语学习词典》,以下简称《当代》)
救 某人或者某物非常危险的时候,帮助他,使他不再有危险。(JUZI)
堆(乙级) 堆积(丙级)。(《现汉》)
堆(乙级) 堆积(丙级)。(《商务馆》)
堆(乙级) 堆积(丙级)。(《当代》)
堆 把东西从下到上一点一点地放在一起,一般会形成一定的高度。(JUZI)
显然以上几部已有词典都是用难词释易词,为无效释义,在外向型学习词典里应努力避免。事实上这种释义现象在汉语词典里比比皆是,如用“堵塞、堆积”释“堵、堆”。
2. 使用高频常用词语,避免使用超纲词,在词典内部形成闭环。如:
大量(乙级) ② 气量(超纲)大,能容忍(丁级)。(《现汉》)
大量(乙级) ② 心胸(超纲)宽广(丁级),能容人(超纲)。(《当代》)
大量 形容一个人在别人做错事情的时候不生气, 经常原谅别人。(JUZI)
如在查询某词过程中还需多次查询释义用词,甚至因为超纲而查不到,这种学习体验可想而知。
3. 使用语体色彩不太鲜明的中性词语,避免使用过于书面化或口语的词语。如:
英俊 容貌俊秀又有精神。(《现汉》)
英俊 相貌清秀好看而有精神。(《当代》) 英俊 (男性,多指男青年)长得好看而且有精神。(JUZI)
过于书面化的词语难度自然高,可理解性差。再如书面词语“患者、出售、购买、场所、悬挂”等在外向型汉语词典释义时宜换成“病人、卖东西、买东西、地方、挂”等。
惦记 (对人或事物)心里老想着,放不下心。(《现汉》)
惦记 因为想念、担心或期待而心里老想着。(《当代》)
惦记 因为想念、担心或者期待,心里总是想着(某人、某物或者某事)。(JUZI)
口语色彩较重的词语“老”适宜换成“总是” 。
4. 采用学习型释义模式,避免百科式释义,尽量减少专业术语。如:
水 最简单的氢氧化合物,化学式是H2O。无色、无味、无臭的液体,在标准大气压(101.325千帕)下,冰点0℃,沸点100℃, 4℃时密度最大,为1克/毫升。(《现汉》)
水 人类必需的最普通的一种液体,没有颜色、气味、味道。(JUZI )
这是一杯水。
半导体 导电能力介于导体和绝缘体之间的物质,如锗、硅、砷和某些化合物。这种物质具有单向导电等特性。(《现汉》)
半导体 一种特殊的物质,只能向一个方向导电。(JUZI )
再如已有学习词典中常用的“草本、木本、食用、家禽”等百科性释义词语都应避免使用。
5. 释义元词表应避免出现同义近义词,选择使用高频简单的词语。如下列词语在释义元词表中共现,可选择后者:
可——可以,无——没有,或——或者,较——比较,应——应该
但——但是,虽——虽然,已——已经, 曾——曾经, 时——的时候
寒冷——冷,书籍——书,询问——问,安装——装
有时——有时候,不便——不方便,不满——不满意
前者——前面的,高处——高的地方,是否——是不是
如何——怎么样,长期——长时间,如——如果
食用——吃,受益者——得到好处的人。
6. 多使用图片、视频等媒体辅助释义。如:
拔 用力往外拉。一般是从地里或者是从固定的地方把某个东西拉出来。(JUZI)
(动图不停地拔草)它正在拔草。
芭蕾舞 一种舞蹈形式。起源于欧洲,女演员一般用脚尖跳舞。(JUZI)
他们在跳芭蕾舞。
7. 采用例举释义时应跳出内向型辞书的思维框架。如:
黑 像煤或墨的颜色。(《现汉》)
黑 颜色像煤或墨一样。(《当代》)
黑 像煤那样的颜色。(《商务馆》)
一种颜色。像这只猫的颜色。(JUZI)
对中国读者来说“煤、墨”也许是具体可感,可以作为典型例证进入释义,但对需要查阅“黑”的汉语二语学习者来说,是不可感知的,不如用一个更加直观的图片实现快捷释义。再如“酸”的释义,按照中国人的思维习惯,“酸”的典型代表自然是“醋”,但对汉语二语学习者来说,“醋”这个汉字很可能超出该水平读者的认知,而且“醋”也不易呈现。在编写外向型汉语学习词典的过程中应跳出内向型词典的思维定式,站在外文化的角度去选择作为例子的典型代表。对比如下:
酸 像醋的气味或味道。(《现汉》)
酸 气味和味道像醋一样。(《当代》)
酸 像醋一样的味道。(《商务馆》)
酸 气味或者味道像柠檬一样。(JUZI )
通过以上释义案例,我们会发现外向型学习词典释义和内向型词典释义具有较大区别。总体来说,释义用词难度低,释义长度长,有的释义稍显啰唆,有的地方用内向型词典的标准去判断,甚至不够精准。对此郝瑜鑫(2019)已有论述:“供本族人查阅的语文词典以促进语言规范化,推广民族共同语为主要目标,因此在释义上追求精细性、科学性、经济性、系统性等原则,释义语言的使用范围不需要严格限制。汉语学习词典的学习者是缺乏目的语的外国人,在释义上应以易懂性为最重要的目标,即让学习者能够看得懂词条内容,获得词条信息,从而促进语言的习得。上述适用于本族人词典的原则并不是主要的考量标准,学习词典很多时候会采用迂回但易懂的方式释义,甚至以牺牲部分准确性、经济性为代价。”这种观点是非常中肯的,当精准和易读之间需要平衡时,在外向型学习词典编纂中有时需放弃精准,而选择可懂会用,如上文的“援助”换成“帮助”就是一个例子。非常遗憾的是,目前很多学者包括外向型汉语学习词典的编者们对此并没有深刻的认识,自然就很难编出真正意义上的外向型汉语学习词典。
三、 元语言意识监控下的释义句型研究及编写案例
如前所言,对于一部外向型学习词典而言,要想使释义浅显易懂,编纂和修改过程除了控制释义元词的数量和难度之外,还应注意释义句型的数量和难度,即在释义过程中尽量使用简单有限的句型,使释义更加自然流畅,通俗易懂。目前关于释义句型的研究较为零散,尚未建立完整的释义元句法体系。JUZI团队目前对释义句型也尚未进入定量统计阶段,本文仅基于对JUZI释义句型的观察和编写经验,提出以下4条操作性建议:
第一,句子尽量简短,降低分句的长度,减少较长的修饰语。当修饰语较长时,可将其改为分句,或删除部分次要的修饰成分。如:
詞典 收集词汇加以解释供人检查参考的工具书。(《现汉》)
把收集的词语按一定的次序排列并加以解释供人检查参考的工具书。(《现代汉语学习词典》)
把词语按一定的顺序排列起来并加以解释的工具书。(《商务馆》)
收集词汇加以解释,供人检查参考的工具书。(《当代》)
词典 一种工具书。在这种工具书里,把词语按照一定的顺序排列并进行解释。(JUZI) 汉语中词和词的界限不是那么显而易见,因此在词典释义时,为了减少学习者出现“分词”困难的现象,应尽量减少长句的使用,避免修饰语过长。以上两个释义虽然修改前后意思差不多,但修改前包含多项定语,句子结构内部比较复杂,特别是“词典”的释义不仅包含“把”字句,还包括“把”字句做定语,多个连动结构做定语等情况,增加了二语学习者的理解难度。我们在JUZI释义中采取化整为零,化繁为简,化规范典雅为通俗易懂的措施,先在读者心理词典确定范围,然后给出限制条件,辅以图片配例达到准确快速释义的目的。
第二,使用现代汉语典型的句法结构。如:
樱花 落叶乔木,叶子椭圆形,花白色或粉红色,果实球形,黑色。供观赏。 (《现汉》)
樱花 这种作为观赏的树,春天开花,花是白色或者粉色的。(JUZI)
这棵樱花已经有100年了。
以上《现汉》释义虽然准确、简短,但除了用词违反上文谈到的释义元语言之外,其包含的句法也不是典型的现代汉语句法,如“花白色”,其完整的形式应该为“花是白色的”,此种释义句法适用于母语者,可增加词典的书面、典雅色彩,同时可减少词典篇幅,但对于外向型学习词典却不合适,大多数汉语学习者通过这种释义很难准确理解词义。为了使释义语言具有可理解性,不仅应减少专业百科性词语,还需将释义句型改成现代汉语典型句型,同时辅以图片释义,从而弥补释义的不足。
第三,以主动语态为主进行释义,尽量避免被动语态、双重否定句等。如:
把柄 比喻可以被人用来进行要挟或攻击的过失或错误等。(《现汉)
把柄 原来的意思是把手。比喻自己的错误或者问题,别人知道后可以用它来威胁、控制自己。(JUZI)
垫 用沙、土等铺、盖在地面上,使地平整、加高或使上面的液体被覆盖。(《当代》)
垫 用土、沙子等类似的东西铺、盖在地面上,使地面变平、变高或者盖上地面上的液体。(JUZI)
对学生来说“被”字句,“进行V”叠加之后做定语等不易理解。
第四,尽量采用中性语体句式,避免使用过于书面化或过于口语化的句式。如:
碟子 盛菜蔬或调味品的器皿,比盘子小,底平而浅。(《现汉》)
碟子 盛菜蔬或调味品的器皿,比盘子小,底平而浅。(《当代》)
碟子 6个碟子。
这种吃饭的用具。样子和盘子一样,但比盘子小而且浅。 (JUZI)
《现汉》和《当代》释义中不仅使用非常用词“菜蔬”,而且“平而浅”这种结构对二语学习者来说过于书面,宜换成中性表述方式。
四、 元语言意识监控下的配例研究及编写案例
(一) JUZI配例元语言抽样考察
和释义一样,外向型学习词典配例用词也应控制在一定的范围内,以使用者看得懂为前提,否则配例就形同虚设。曾丹(2015)认为“例子中的词语应尽量控制在《新HSK大纲》的词汇范围之内,少用或不用超纲词汇”。我们认为配例确实应遵循元语言原则,但对于一部外向型学习词典来说,其配例语言不能只考虑用词的难度,还应考虑以下几个因素:
第一,配例用词总量:配例用词应限制在一定的范围内,但会远远大于释义元词,即要有一定的丰富性,不应一味追求难度低而忽略丰富性;
第二,配例用词难度:固然要考察一部词典所有配例用词的难度,但更要考察某个具体词语的配例用词是否高于该被释词;
第三,配例用句难度。
不少学者已指出汉语学习词典在配例方面存在的问题,如刘川平(2006)“用例内容和语言没有完全跳出面向国人的词典的路子,没有充分考虑读者对象的特殊需要”。为了考察JUZI配例用词难度和丰富性,我们对其配例进行了定量考察。因配例文本很大,大规模配例情况的定量统计尚未完成,我们仅抽取A字母段所有词语的配例进行了抽样统计分析。统计结果如图5所示:
A字母段配例共用词8580个,其中甲级词6236个,占比72%,乙级词972个,占比11%,丙级和丁级词分别为398个和451个,占比5%左右,超纲词623个,占比7%。但根据对超纲词的单独考察,我们发现很多所谓的超纲词并非真的超纲词。主要是由以下几种情况造成的:
第一,自动分词不准确,如:家家、试试、第一、回家、挨到、见到、坐在、找到、挨门挨户、周一、周日、暗下(决心)、来安、打凹、一个、两本等是因为分词软件造成的“假超纲”。
第二,配例中使用的专有名词,如:张大明、小李、老王、罗密欧、朱丽叶、中国、美国、法国、北京、上海、纽约、巴黎、东京、故宫、长城、四川、西藏、雅典、张家口等。这些专有名词在配例里一般也不会增加难度,只是因为大纲没有收录,造成“貌似超纲”。这些所谓的专有名词如果为了降低配例难度是可以换成“他”或者大纲收录的专有名词的,但我们认为配例应该具有丰富性,让不同地区的学生都能看到自己身边的地名,比所有例句都是“北京”要好很多。
第三,大纲遗漏的高频常用词,如父母、超市、绿色、红色、吃饭、造成、车子、大雪、手机、钱包等,现在使用频率非常高,但因为大纲陈旧没有收录,造成“貌似超纲”。
第四,真超此纲但不超彼纲,如爱国主义、按部就班、安居乐业、奥运会、按摩、傲慢、爱慕、安宁、熬夜等,都是词典的词目词,配例必然会高频出现。我们词典收录的总词表是三个大纲合成的涵盖面最广的并集,而判断文本難度的根据只是旧版HSK大纲,难免出现“超此大纲,实则在彼大纲”的现象。
通过上面的分析,我们可以看出,表面上看有7%的超纲词,实际上如果把上述所谓的假性超纲词剔除,根据我们大致排查,真正超纲词为200个左右,占比不足3%,这样的难度是不影响阅读理解的。整体来看,JUZI配例用词比释义用词丰富,数量更多,实际难度不高。目前只是小规模抽样统计,可能还不足以过早对JUZI配例难度下结论,最终结果有待对词典配例大规模统计结果。 (二) 外向型汉语学习词典配例编写建议及案例
为了在丰富性的前提下降低配例难度,在具体编写过程中应注意以下几点:
1. 配例尽量简单,遵循例句用词低于被释词的原则,但同时也应兼顾配例用词的丰富性,如一个5级被释词,其配例用词可以是用1—5级的词汇,不能只用简单的1、 2级词汇,也不能使用6级的词汇。对比如下:
爸爸(甲级) 爸爸,你偏心眼儿(超纲)。(《当代》)
爸爸(甲级) 爸爸,我们去打篮球吧。(JUZI)
办法(甲級) 粉碎(丙级)谣言(丙级)最好的办法是用事实(乙级)来说话。(《当代》)
办法(甲级) 学好汉语最好的办法是多说多看。(JUZI)
2. 配例特别是排在前面的配例尽量要有帮助读者解码的语境,但在保证语境完整的前提下,配例尽量不包含过多的修饰语。如:
巴不得 我巴不得能休几天假。(《当代》)
巴不得 A:我去给你打工行吗?
B:我巴不得你马上就能来,我一个人实在干不完。(JUZI)
没有语境是很难真正理解“巴不得”的使用条件的,但并非语境越多越好,如对“八”而言,《当代》的配例显然有点画蛇添足:
八 宿舍有四张高低床,可以住八个人。(《当代》)
八 八根香蕉。(JUZI)
3. 充分利用语料库,但不可直接照搬,必须经过编者的选择和改编。语料库提供丰富的语境,编者优化保证用词难度,充分利用人机互助人机结合。如:
帮忙 诸葛亮对他说:“三天之内要造十万支箭,必须请你帮忙。”(CTC语料库)[5]
修改为:她说:“时间太紧张,我一个人做不完,请你帮忙。”(JUZI)
帮忙 他最好的朋友找他帮忙,倒被他拒绝了。(CTC)
修改为:他最好的朋友找他帮忙,他虽然很忙,但还是愉快地答应了。(JUZI)
4. 使用和被释词难度相应的句型,避免过难的句型。如:
爸爸 她被爸爸批评了一顿。(《当代》)
爸爸 今天是我爸爸的生日。 (JUZI )
“被”字句的难度显然高于“爸爸”,不应在“爸爸”配例中出现。
5. 配例中尽量少用没有语境的俗语歇后语等。如:
买 一寸光阴一寸金,寸金难买寸光阴。(《当代》)
买 家里没有水果了,我去买一点水果。(JUZI)
6. 为了保证配例的真实性和可理解性可辅以图片或视频。如:
发达 袋鼠的前肢不太发达,后肢很发达。(JUZI)
五、 结 语
通过上文的分析可以知道,若想提高外向型汉语学习词典的可读性,在词典编写和修改过程中都应贯穿释义元语言意识;释义元语言意识不仅体现在释义用词方面,还体现在释义用句方面;不仅体现在释义中,还应体现在配例和辨析等整个环节词典编写环节中;不仅体现在编写过程中,还应体现在修改过程中;不仅要在整部词典编写过程中控制总的释义用词数量和用句的难度,在具体每个词语的编纂过程中都应尽量做到释义用词用句低于被释词的难度等级。有元语言意识容易,但落实难:不仅要有元语言意识,还要对词汇难度有基本的判断,这就要求最好是有丰富汉语教学经验的老师参编,方可真正体现外向型学习词典的语言特点。最好的编写模式是由教学经验丰富的汉语教师参与,由专家进行各种知识性把关。语料库等计算机技术至关重要,可以加快进度,节省大量时间,但单纯依赖技术绝对编写不出好词典。教学经验固然重要,但定量科学统计不可缺少。“看得懂”是一部外向型学习词典的基本要求,除此之外,还应让用户看得高兴,看得“爱不释手”,此问题我们将另文讨论。
附 注
[1]JUZI为30余位教学经验丰富的汉语一线教师历时7年参编完成的一部融媒汉语学习词典App,全典700万字,2万张图片。正进行技术生成。
[2]2020年由商务印书馆出版的《当代汉语学习词典》应该是这方面的一个尝试。
[3]“汉语阅读分级指难针”(languagedata.net/editor)为金檀、陆小飞、林筠、李百川共同主持研发的阅读文本的难度定级与智能改编系统。
[4]“汉语阅读分级指难针”每次仅能统计2000字,故需分多次统计计算平均值。
[5]“CTC语料库”即北京师范大学中文信息处理研究所“汉语国际教育动态语料库”(Corpus of Teaching Chinese as Second Language)。
参考文献
1. 安华林.现代汉语释义基元词研究.北京: 中国社会科学出版社,2005.
2. 安华林,曲维光.《现代汉语词典》释义性词语的统计与分级.语言文字应用,2004(1).
3. 国家对外汉语教学领导小组办公室汉语水平考试部.汉语水平词汇与汉字等级大纲.北京: 北京语言学院出版社,1992.
4. 郝瑜鑫.定量研究与汉语学习词典编纂理念的创新.云南师范大学学报,2019(5).
5. 霍恩比.牛津高阶英汉双解词典(第8版).北京: 商务印书馆,2014.
6. 蔡永强.外向型汉语学习词典的释义用词.辞书研究,2018(4).
7. 李尔钢.建立高质量的释义元语言.辞书研究,2007(1).
8. 李忆民主编.现代汉语常用词用法词典.北京: 北京语言学院出版社,1995.
9. 李智初.对外汉语学习型词典释义的优化.辞书研究,2012(6).
10. 刘川平.对外汉语学习词典用例的一般原则.辞书研究,2006(4).
11. 鲁健骥,吕文华主编.商务馆学汉语词典.北京: 商务印书馆,2006.
12. 施光亨,王绍新.汉语教与学词典.北京: 商务印书馆,2011.
13. 苏新春.汉语释义元语言研究.上海: 上海教育出版社,2005.
14. 孙全洲主编.现代汉语学习词典.上海: 上海外语教育出版社,1995.
15. 翁晓玲.基于元语言的对外汉语学习词典释义模式研究——以《商务馆学汉语词典》为例.华东师范大学博士学位论文,2011.
16. 武建宇,宋文辉.辞书元语言的建构原则.辞书研究,2009(4).
17. 夏立新.对外汉语学习词典的出版和使用者调查研究.出版科学,2009(1).
18. 杨玉玲,杨艳艳.汉语学习词典调查分析及编写设想.现代语文,2019(2).
19. 曾丹.论对外汉语多媒体学习词典的释义和用例原则.语文学刊,2015(1).
20. 章宜华,杜焕君.留学生对汉语学习词典释义方法和表述形式的需求之探讨.华文教学与研究,2010(3).
21. 章宜华.对外汉语学习词典释义问题探讨——国内外二语学习词典的对比研究.世界汉语教学,2011(1).
22. 张志毅主编.当代汉语学习词典.北京: 商务印书馆,2020.
23. 中国社会科学院语言研究所词典编辑室.现代汉语词典(第3、 7版).北京: 商务印书馆,1996, 2016.
24. 中华人民共和国教育部,国家语言文字工作委员会.汉语国际教育用音节汉字词汇等级划分(汉字表),2010.
(北京语言大学人文学部/汉语国际教育研究院 北京 100083)
(责任编辑 刘 博)