论文部分内容阅读
随着计算机信息处理技术及计算机应用的日益普及,少数民族文字的计算机信息处理也开始成为计算机应用领域的一个重要研究方向。
藏语是少数民族的一大语系,藏族人民有着两千多年的文化历史,藏文信息化技术将为藏族人民在工、农、牧、副业、广播电视、通讯、现代化教学科研、网络信息工程等领域,插上腾飞的翅膀。但是,由于支持藏文信息处理的工具相对滞后,所以研究藏文的输入、显示和编辑技术,解决相关的理论问题和应用课题显得十分重要。研究藏文信息在因特网上和各种应用程序中传送和运行,对西藏自治区的科学研究、文化教育和信息产业的繁荣发展具有重要的意义。
但是藏文是一种古老的拼音文字,除了进行横向拼写外,同时还进行纵向拼写。基字与语音、元音、上加字、下加字的纵向拼写构成字元。前加字、字元、后加字、再后加字进行横向拼写构成藏文字。由于藏文独特的拼写方式给藏文软件的开发带来了很大的困难,而现有的藏文软件为了减少开发难度都不完全支持国际编码标准――ISO/IEC 10646(或Unicode)。
当前的藏文计算机处理软件由于设计方面和国家标准方面的原因,存在着字符收录不全、与国家现行标准不相符等缺陷。这些系统设计上的不足,造成了藏文处理软件在应用领域互不兼容且应用领域受到局限。
本文以设计一种藏文信息处理平台为目标,力争能够实现对中、英、藏文的混合处理。在详细分析了藏文字母构成、藏文字符拼写规则及Windows的字体文件结构后,本文提出了一个实现藏文信息处理的新方案,即将藏文作为拼音文字来设计处理方案。
因此,本文针对藏语言文字的语言特点与民族语言信息处理的应用需求,重点研究藏语言信息处理中的关键技术,深入了解藏语言文字的文字特点,详细阐述藏文字符集标准,通过对多种编码体系和字符显示技术的比较分析,选择ISO/IEC 10646、Unicode字符集和OpenType字体技术来建立藏文字库,并通过剖析Windows操作系统对多语言和输入法支持的内部机制,阐述了输入法实现的基本原理,基于系统提供的编程接口,在国内主流的Windows系统上开发支持藏语言文字正确显示的操作系统平台。在输入法内部码表实现中,采用了哈希表与顺序查找相结合的方法,提高了字符的查找速度。建立规范化、标准化的少数民族语言信息处理体系和技术规范,提供标准的系统接口,以便进一步开发适用于少数民族地区、面向特定领域的系列应用产品,形成产业规模。
在本论文中,首先了解了藏文在世界文字史上的重要地位和其计算机信息处理的现状,从中可以了解其信息化建设的必要性和紧迫性;接着在分析藏文字符特征和计算机化技术难点的基础上,提出合理的信息化解决方案,并对相关技术进行了详细介绍;随后对方案的具体实施包括藏文字库的建立及输入法实现过程,从原理、结构、应用等方面进行详细的分析,并与其它少数民族文字系统进行了比较;最后给出了其在网络上的应用实现,使理论研究上升到实际的应用。