论文部分内容阅读
计算机技术的迅猛发展以及古文字资料的大量出土,使得利用计算机研究古文字成为一种趋势,“古文字信息化处理”迅速发展为一门集实用性与快捷性为一体的学问。近十年间,来自计算机专业和古文字学专业的专家学者不断探索计算机和古文字结合研究的最佳渠道,但古文字信息化处理研究仍处于起步阶段。目前,古文字字符编码还未进入国际字符编码标准,无法建成在全球范围内通用的古文字字库,实际意义上还未实现利用计算机对古文字进行各种处理研究。 本文在简单介绍了字符编码标准、字体技术以及古文字本体研究的发展后,提出了古文字信息化处理所面临的瓶颈性问题的解决方案。首先,以甲骨文和金文的已识字为研究对象,提出古文字字符进入字库前所进行的字形整理的必要性及整理理念,整理出符合计算机处理要求的古文字字样,这和传统的古文字本体的字形整理有着本质不同。其次,基于本文研究材料,提出了“字位”概念,使得一个古文字的不同字形可以共享一个 Unicode码位,并且可以同台显示这些码位相同、字形不同的古文字。再者,本文提出了“字库的演变制作”方案,以甲骨文和金文的断代分期为框架,依照时代先后分别建成13个甲骨文和24个金文.TTF格式的分字库。最后,在对所选字样的属性进行尽可能完备的标注基础上,做成了大型的“古文字数据库”,“古文字属性标注数据库”的建成实现了甲骨文和金文完整的计算机检索平台。至此,在充分结合古文字异写字特点以及计算机数字化要求的基础上,提出的设计理念充分满足了不同使用者的需求,建成了甲骨文和金文已识字在全球范围可通用的古文字字库,真正实现了甲骨文和金文已识字的计算机处理。