基于Unicode编码的现代藏文排序系统的设计

被引量 : 0次 | 上传用户:lvzhenzhuo112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文排序问题是藏文迈向信息化的重要支撑之一。藏文的大量的编目、检索工作,包括人名排序都要求藏文以有序的方式排列以提高工作效率。藏文排序又是各种辞书、工具书编写中亟待解决的首要问题。解决了藏文排序,可以为后续的藏文信息处理奠定基础。由于藏文独特的二维结构,藏文排序相比其他文字的排序要复杂。根据现代藏文的辞典序以及现代藏文的结构,提出了将二维的藏文音节展开成形如“基本辅音+前加辅音+上加辅音+下加辅音+元音+后加辅音+又后加辅音”的线性字符串,其中空缺的部分用Unicode码值较小的空格来代替的方法,最后通过比较排序码得到与辞典序相同的结果。整个现代藏文排序系统由输入模块、音节切分模块、音节判定模块、排序码的提取与压缩模块、排序码的比较模块、结果显示模块组成。其中在音节判定模块中,根据现代藏文的特点和Unicode藏文编码的特点,设计了独特的音节判定算法。经过音节判定之后,从DUCET中提取相应的排序码。由于提取的排序码有很多重复和为零的部分,因此,还要对排序码进行压缩。经过压缩的排序码就可以通过排序算法进行排序了。根据以上各模块设计的排序系统能够对现代藏文进行正确的排序。
其他文献
高校辅导员是大学生思想政治教育工作的骨干力量,承担着大学生日常思想政治教育工作的主要任务。“言传”和“身教”相结合是我党思想政治教育工作的一大优良传统,辅导员在日常
近些年来,组织认同理论已成为组织行为学中的一个热门的研究领域,很多学者研究发现,组织认同对于组织忠诚,组织公民行为等有显著影响,通过对员工个人认知和情感的影响,进而影响员工
研究背景神经病理性疼痛是指由躯体感觉神经系统的损伤或疾病而直接造成的疼痛,主要以痛觉过敏、感觉异常、自发性疼痛等为特征。全世界约有3%的人正在遭受神经病理性疼痛的
随着肉鸡产业的工厂化的发展,疾病风险成为了影响其成活率的主要因素之一,其中新城疫(ND)、禽流感(H9亚型)以及法氏囊(IBD)等疫病对肉鸡产业造成了巨大的经济损失,免免疫接种是防制N
在1000MW机组锅炉上进行了燃烧调整试验,通过改变过量空气系数、机组负荷、燃尽风率和配风方式,对烟气NOx的排放规律进行了研究。结果表明:随着过量空气系数的增大,NOx排放浓度显
法律援助制度是促进社会公平正义,保障和改善民生的国家救济制度。虽然法律援助制度在我国建立已有30年时间,但是依然存在“维权难”问题。而诉讼保险制度作为从西方引进的保
背景:研究证实深层海水可通过激活AMPK通路下调小鼠对糖的摄入,进而有效缓解高脂肪饮食诱导的小鼠糖尿病进程,然而目前有关深层海水在糖尿病创伤难愈合中的作用研究鲜有报道
苦瓜枯萎病是由尖孢镰孢菌苦瓜专化型(Fusarium oxysporum f.sp.momordicae)侵染引起的一种土传病害,目前市场上缺乏防治效果较好的农药或生防菌剂。为了更好地防治苦瓜枯萎
中国民用对地观测卫星在近10 a得到迅速发展,2012年和2013年相继发射的ZY-3和GF-1遥感卫星已成为中国现阶段主要应用的高分影像卫星,但二者对地观测能力是否相同并不清楚。因
涉及国家秘密的信息资源一旦泄露便会使国家的安全和利益遭受到严重损害。涉密信息系统作为其载体,一直以来都是国内外、境内外敌对势力对我攻击的重要目标。现代信息技术的