论文部分内容阅读
本文分析了方块壮字的性质、历史、现状、语料典籍和汉字的“四定”(定形、定音、定量和定序)等情况,以方块壮字信息化标准化为中心,做了如下探索:
标准化方面:梳理重要语料;以《古壮字字符集》(包括增补部分)为字形基础,在Windows XP平台上,选用包含中日韩越(包括港台)表意字符的超大字库,利用字形输入法,分拣统计出与汉字字形不重合的方块壮字7247个,重合的5173个;探讨语料库构建,从用字等级角度分析了语料《壮族麽经布洛陀影印译注(共八卷)》,尝试了一些类似OCR文本自动识别软件和ROST字频统计分析软件等,为方块壮字标准化提供了具体的方法支持。
信息化方面:分析了UCS的组、平面、行和列组成的四维空间及UCS-4编码方案,并进一步分析了基本多文种平面A、I、O、R四个区以及其UCS-2编码方案,根据UCS的标准、方块壮字情况以及汉字空间位置,分析论证方块壮字应该存放于O区,代码区间应该为A000-DFFF;采用造字软件FontCreator模拟建造了含有1000个方块壮字的TrueType字库,并在操作方法上做详细记录;借助相关软件,使用“四角号码”创制了1000字的输入法,尝试了部分方块壮字的计算机录入。
最后提出方块壮字信息化标准化的总体流程:首先借用汉字码位空间,模拟实现方块壮字信息化:然后完成符合ISO认证要求的方块壮字标准化工作,通过ISO认证,获得码位空间;最后彻底实现方块壮字信息化标准化。