学习《通用规范汉字表》对话录

来源 :汉字文化 | 被引量 : 0次 | 上传用户:sxh6916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文以甲、乙对话的形式写出了一些学习心得,与读者交流。作者作为一名理科教师,发现《字表》的一个特别值得注意的地方是:从《字表》文本,到各种宣传、讲解、访谈,几乎没有提及过当今国家的强制性汉字编码标准GBl8030。而这个标准对于汉字的规范具有极端的重要性。《字表》是一个极好的案例,通过它我们可以分析、讨论汉字从厄运的铅字时代跨入电脑时代的转型进程中的种种问题。1994年是汉字跨入电脑时代的伟大年份。2014年就是汉字跨入电脑时代20周年。仅以此文纪念(迎接)这个伟大年份。
  一、《字表》使我对破解两岸汉字难题增加了信心
  甲:我最近花了许多时间学习《通用规范汉字表))。收获颇多。其中一点就是:我对破解两岸漢字难题增加了信心。
  乙:我也在学。不过我可没有你这样的认识。《字表》里把繁体字几乎打成‘非规范字’,又继续类推了226个新简化字。这让使用繁体字的人大为不爽,怎么能够说“对破解两岸汉字难题增加了信心”?
  甲:你说的这两点确实对破解两岸汉字难题有负作用。对这两点我也持保留态度,留在以后另做讨论。就《字表》本身和国务院批示看,并没有明确把繁体字打成“非规范”,应该算是隐含着一些意思吧。只有王宁组长明确在解说时,把繁体字说成“非规范”。这应该还只能算是个人观点,肯定不是国务院完全认同了的。我们既要注意研制者的观点,更要看重所提出的基本事实。我的增加信心,来自《字表》的基本事实。
  乙:此话怎讲?你指的是什么?
  甲:《字表》算是第一次给出了“规范的简化字”的总数量。这一点很重要。大家都知道:1986年的《简化字总表》收简化字2235个。但由于后来常用字表、通用字表发布时又有不少类推简化。简化字总数一直说不清楚。长期里对简化字总数的心中无数,是很不正常的。这次算是有了个进步。
  乙:简化字总数到底是多少:
  甲:《字表》附件一之(三)中说:“本表收录了与2546个规范字对应的2574个繁体字”。显然的,这2546个就是规范的简化字。又由这其中有约160余个新类推简化字在GB18030里没有,其合法、合理性有待进一步讨论。我们就以2386(=2546-160)当作是规范简化字总数。
  乙:这有什么重要?
  甲:8105个通用规范汉字里,有2386个简化字。这表明简化字占29.41%,即不足三分之一。这表明,通用规范汉字里,简化字并不是主体。换句话说:说简化字是汉字的主体的说法没有根据。
  ‘
  乙:谁说了“简化字是汉字的主体”?
  甲:许多汉字改革家持此观点,这是汉字改革家们的一个核心观点。如一位苏教授就这样说。他在国家图书馆的讲座里讲的。后来在光明日报全文发表(2009-5-28日6、7两版)。这个主体论是他论证“汉字进入了简化字时代”的重要依据。
  乙:你这个比例仅仅是相对于通用规范汉字的呀?
  甲:是呀。这里的2386个,是规范的简化字。8105是通用规范汉字。《字表》前面的说明第六款里明确地说:“本表对社会上出现在‘简化字总表’及‘通用字表’之外的类推简化字进行了严格甄别才给出了本表中的简化字。”又按照周有光、胡乔木先生的意见“简化常用字好,简化罕用字不好”。1986年的全国语言文字工作会议上明确指出“今后,对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对稳定,以利于社会应用”。我们可以认为这个2386个汉字几乎是全部规范简化字。换句话说8105之外不应该再有其他简化字,或者甚少其他的简化字。这样,如果把基数改为其他字符集的规范汉字数,如1995年的GBKl(扩充的汉字编码字符集)字符集中的汉字数21886,则简化字所占比例为:10.90%;而当把基数改为当今强制性标准GBl8030-2000中的27484时,简化字的比例仅为:8.68%。
  乙:这对解决两岸汉字问题有什么意义?
  甲:大陆与台湾汉字的差异,主要就是简繁体汉字之间的差异。当今强制性国家标准GBl8030-2000是遵循国际文字编码标准制定的,通行于华人世界。简化字仅占8.68%,也就是说大陆与台湾文字差异量还不足9%。如果更多考虑一下台湾情况,取台湾早期的汉字编码字符集“大五码”的汉字数(13053)为基数,那么简化字的比例应该为:18.28%。仍然可以说大陆与台湾所使用的汉字是大同小异的。差异不到五分之一(<20%)。
  乙:这一点和通常的认识可是很不一致呀!
  甲:那正是两岸文字差异被夸大了,被歪曲、被激化、被误读了。此次的《字表》对澄清这一点误解是有好处的。
  乙:问题是:调整2386个简化字也是件不容易的事呀?
  甲:根本不需要全部调整,也不需要大部分调整,只需少量调整就能够解决大问题。由于当今简繁体汉字都成功地实现了电脑化,并且从1995年推行GBKl起,简、繁体汉字已经实现了兼容、共存及便捷地转换。当今一个最烦人的事:简到繁的转换中经常有错。但只要把简到繁的“一对多”改为“一对一”,计算机就能够实现完全自动化的、几乎无差错的转换。关于最少恢复几个繁体字就足够了?这是有争论的。少者数十,多者近千,大多数是一百多个(详见《汉字书同文研究》第六、第八集)。此次的《字表》给出了一个有力根据:附件一的(三)里,已经明确给出《字表》里的“一对多”总计96组。作为粗略估计,如果96组里“一对二”占3/4,为72组;“一对三”占1/4,为24组。那么全部需要恢复的繁体字为72+2*24=72+48=120。恢复了这120个繁体字(涉及的简化字数目占简化字总数的:5.03%,已经足够小),计算机就能够帮助使用两种汉字的人,方便地把对方文件,转换成自己熟悉的文件。操作仅仅是弹指一挥间。所以,这个最少120字的结论极有价值。
  乙:问题有这么容易吗?《字表》研制组组长王教授曾经说“恢复繁体字代价太大”呀(2009年《字表》公示后的电视访谈)!你这一下子就是120个呀!   甲:实际上,1995年GBK1推行时,繁体字字库及软件已经建立,并且已经以简、繁兼容、共存方式成功提供广大公众使用。当时收入汉字已经达到21886个。当今要恢复繁体字,已经几乎不需要什么消耗,消耗在1995年前都已经支付过了。这就像已经做好了两道菜川菜、粤菜,吃川、吃粤(类似于用简还是用繁)可以悉听尊便。当今,对于已经成熟的汉字软件来说,简、繁体汉字的使用,对于个人,几乎是可以简、繁体任自由选择了。现在问题就像是:管家给不给家人自己选菜的自由。从研制者们的言论、文章看,他们几乎完全不知道简、繁体字这两道菜1995年(GBKl实施的年份)就已经烹调好并摆上了同一张饭桌的事实!就是说,当今所有的同一台中文电脑都是简繁体兼容的。
  乙:你这里说:恢复120个繁体字容易,那为什么44个字形微调及新类推简化字160却出了严重问题,怎么一回事?
  甲:这涉及电脑外字问题。下一节再讨论。
  二、汉字的身份证、异体字转正及电脑外字问题
  甲:《字表》把45个异体字调整为规范字。此事作为《字表》的一个重要特点、优点广为宣传。一种形象化的说法是:《字表》给这些异体字发了“身份证”。而其实,这些异体字的“转正”在1993年就基本完成了。由谁完成的?由国家技术标准。证据在《字表》配套的字典里就能够找到。因为该字典里的附录里给出了汉字的IS010646编码。如下是字例:
  字表里的序号汉字IS010646中代码
  5401
  皙07699
  7294
  喆05586
  7371
  淼06DFC
  6674
  昇06607
  6530
  邨090A8
  这清楚地表明:上述五个异体字在ISO10646—1993中是存在的,即列入了字符集并且有了字库。而GBl3000—1993是與这个国际标准的等价的国家标准。它又是后来1995年的GBK1及2000年的GBK2(即GBl8030)的子集。所以,这些异体字从1995年起就一直像“上、下、大、小”等字一样通用于所有中文电脑。
  乙:汉字的“身份证”到底谁管?谁发呀?
  甲:按说,汉字的“身份证”应该由主管语言文字的国家语委管。但由于汉字电脑化浪潮来得突然、迅猛、意外、神奇,排山倒海、打破常规,使得在上个世纪八九十年代,原本就比较缺乏技术常识的国家语委的一些领导、专家们,对这一场突如其来的汉字电脑化浪潮还处于充满惊讶、不理解、疑惑、忧虑的状态中。事实上,在汉字处理电脑化中有重大历史意义的七四八工程起步调研的1973年,毛泽东批示《光明日报》文字改革专刊复刊,周恩来批示恢复中国文字改革委员会。两位领袖的这两个批示,实际上推动了因动乱停止了的文字改革工作的恢复。汉字电脑化运动和文字改革恢复工作就这样并行地同时展开了。国家语委(前文字改革委员会)还一直忠诚地忙于汉字改革(名称改为语文现代化)。关乎汉字命运的许多重大技术难题的解决,都是以技术工作者为主完成的。语言文字界和信息技术界长期里两股道上跑车,不协调是很严重的。现今的许多问题,包括此次《字表》所反映的问题,就是长期里两张皮状态的表现或后果。但毕竟国家语委是主管汉字的,虽然晚了20年,走一次“补发”的手续,也无不可。
  乙:那么,新时期汉字的“身份证”到底什么意思呀?
  甲:有“身份证”应该是指“实际上能够为广大汉字用户使用的”,显然,这个“使用”是通过电脑及网络的“使用”,而非个人手书笔写的使用。一个汉字能够做到这一点,需要:①被收入编码字符集;②在汉字编码表里获得一个位置,或得到一个属于它的二进制代码;③给出它的字形信息,包括一般至少四种字体、数十种字号的点阵字形信息;④有多种汉字输入法给出每个汉字及相关词、短语的输入代码;⑤有相应的操作系统及文字处理软件。特别是前四款,必须对每一个汉字单独给出。从这五个条件看:1993年,这些异体字仅仅解决了①、②、③;到1995年五条都完备。国家语委最近的发“身份证”仅仅做了这里的①,仅仅有象征性价值,仅仅是办一次‘补发’的手续。就是说,这些异体字的“身份证”实际上是在1993年就由技术标准发过一次啦。
  乙:你还是没有说清楚恢复120个繁体字,推出160余个类推简化字,以及44个字形微调字有什么不同,为什么120个容易,那160和44就行不通?
  甲:关键是电脑外字的概念。那120是GBl8030里有的,有“身份证”(具有前述的①到⑤),是电脑里存在的、收录了的,或者说是电脑内字。而那160个新类推简化字及44个微调字都是电脑外字,即最关键的是,对于这些字,上述②③④⑤没有做,特别是②没有做。电脑外字的最关键特点,可以用②的是否缺失判定。没有这个②就是电脑外字。外字是电脑无法处理的:无法输入、无法显示、无法编辑……
  乙:44个字形微调字,是电脑里原来有的呀,对它们上述①到⑤都有的呀?
  甲:原来的那44个字,确实是内字,也是不能够采取简单取消,由44个新字取代的。原来那44个字不仅仅存在于亿万台套电脑设备、系统里,还存在于同样海量的(电脑外部的)软盘、U盘、光盘、硬盘等存储器中。不能简单取代,只能新增加44个字形微调字。这新的44个可就①到⑤完全没有了。
  乙:现在的160个新类推简化字,和其他电脑里已经有的类推简化字,看起来没有区别呀!怎么就这160个不行?
  甲:是的,类推简化字本身之间没有什么不同,但它们提出的时间不同。如果这160个,在2000年前,在GB18030发布之前告知汉字编码标准小组,那就完全没问题,列入字符集即可。但现在拖到了2013年,GB18030都已经强制性推行了13年的时候,十数亿台套的电脑设备与系统都已经装好了它,想修改就太难了。这相等于短时间内制作、发放三五十亿张二代身份证那样的麻烦。
  乙:不对吧,这160余个新类推简化字在网络发布时,在配套的《字典》、《解说》里都明明白白地印刷出来啦。
  甲:请注意:网络发布《通用规范汉字表》文本时,是一种图形方式。每个字,或者每一行字,都不能相通常汉字编辑软件那样,做编辑加工。这种图形显示方式把“外字问题”隐瞒了起来。《字典》,《解说》里能够印刷出来,只要商务印书馆的计算机里造了这些外字,就行了。可是广大公众的计算机里没有这些字。广大公众的计算机上无法显示、编辑、打印这些字。商务印书馆的《字典》的电子版(用光盘或u盘存储的)拿到广大公众的计算机上,无法正确地显示出来,或者发生乱码现象。外字无法经过网络流通,无法经过光盘、u盘进行数据交流。这些外字仅仅存在于商务印书馆的计算机里。
  乙:哦,原来如此。
其他文献
<正> 二、道路试验有关转向器的整车道路试验是在日本 NSK 公司前桥工厂的试车场中进行的,该试车场长约200米,最宽处50米,呈菜刀形(见图1)。试车场主要进行转向器装车后的整
[摘要]英语是现代人的一个重要交际工具,它已成为我们生活、学习、工作中必不可少的一部分。而学好英语的前提是学好语音,但是语音的教学被很多高校师生所忽视。更是很少有人对语音存在问题的学生进行深入调查研究。本文对一名语音问题学生进行个案研究,找出其发音存在问题的原因,提出解决办法希望对语音教学有所启示。  [关键词]英语专业 语音问题 个案研究    一、问题的提出    英语是现代人的一个重要交际工
本文以国内外大量的研究成果和试验资料为依据,论述了农业四轮驱动拖拉机的使用性能,阐述了四轮驱动拖拉机的结构特点和总体形态,从而论证了四轮驱动是很有发展前途的拖拉机