论文部分内容阅读
《CJK编码字符集》是当今通用性最强的国际性汉字编码字符集,其本身是开放多元的,目前仍在不断扩展补充汉字编码,但是CJK的收字原则及收字状况是客观的,存在收字不全、系统性不强,缺乏整理等问题。随着计算机用字在社会生活中的广泛应用,对汉字编码字符集所收字形进行规范整理势在必行。《类篇》作为一部代表北宋官修字书编纂最高水平的字书,其历史汉字字形用来查验和补充汉字编码字符集是不可或缺的。通过《类篇》字形与《CJK编码字符集》字形的平行比较,可以进一步探索字符集扩大收字范围的方法和思路,使之更好的适用于古籍整理。 本文从对《类篇》15398个楷字字形与CJK字形对比的角度入手,归纳二者在笔形、笔画、部件层面的差别。经过分类统计,《类篇》字形在CJK中尚未编码的占0.31%,二者共有字形中有差异的占63.1%,没有差异的占36.6%。 同时,本论文还解决了以下三个问题:1、通过《类篇》字形与CJK字形的对比,考察了二者字形差异的具体原因,即由于信息处理中的认同原则以及造字转写讹误等原因导致的字符集中对古籍字形错漏失收的诸多情况;2、通过《类篇》字形与CJK字符集字形的对比研究,对《类篇》本身存在的字形问题进行深入的思考;3、对《CJK编码字符集》扩大收字范围的方法和思路提供一些建议,从而使CJK更好地适用于古籍整理。