藏文网页的编码识别与转换

来源 :中国中文信息学会二十五周年学术会议 | 被引量 : 0次 | 上传用户:bqrxbqrx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文字符集标准发布较晚,导致目前使用的藏文编码多种多样.本文按编码所属体系分类介绍了26种藏文编码,讨论了藏文编码转换中的关键问题,介绍了藏文结构特点和统计学特征,介绍了各种可能的识别准则并进行分析比较.确定了使用以藏文的音节点间距规律为特征的识别准则识别15种藏文编码;使用以藏文高频音节为特征的识别准则识别其余11种藏文编码;使用以藏文句子结构特点为特征的识别准则发现未知藏文编码的方案.设计了藏文网页的编码识别与转换系统.测试结果表明,系统能够正确地识别藏文网页和区分非藏文网页,并能够正确地转换为Unicode字符集UTF-16LE编码.
其他文献
本文列举了一些以氨作为制冷剂的中、大型冷库在系统安装及使用中的安全问题,并指出随着制冷行业的国际化,制冷系统新的发展方向将是业内人士需要认真研究的问题.
以国外最新制定或修正的冷冻食品安全法规、规范或标准为基准,介绍了食品的冷冻过程、冷冻食品储藏、冷冻食品温度控制以及解冻食品的品质等方面的部分法规或要求,并得出以下
通过对不同开孔直径、不同压差工况下葡萄包装箱内的温度变化进行实验测试,得到葡萄箱内的温度分布,获得了适宜的差压预冷葡萄保鲜的时间、差压和包装箱开孔直径.
分析了国内肉类消费水平的现状,论述了冷却肉与热鲜肉、冷冻肉之间的区别与各自的特点.认为大力发展冷却肉生产,建立冷却肉物流冷链体系将是肉类工业的一场革命,也是21世纪肉
本文简述了冷库、冷藏、冻结设施及制冷设备的日常管理的相关内容,并列举了一些案例进行分析,说明冷库管理的重要性.
本文研究一种利用废热的复叠式制冷技术,考察其节省压缩式冷冻机电耗的潜力。在气温相对湿热的季节,利用废热制冷机组制取较高温的冷水,供给压缩式制冷机组作为其低温冷却水。通
自由活塞斯特林制冷机采用了直线电机驱动、板弹簧支撑、间隙密封、气动驱动等先进技术,具有结构紧凑、重量轻、无油、运动部件少、可靠性高、低噪音、低振动、不易磨损、寿命
经济器可以有效地改善空气源热泵在低温环境下制热性能和运行可靠性差的问题.本文介绍了带经济器的涡旋压缩机准二级压缩热泵系统,并基于热力学第一定律,对闪发器前节流系统
介绍了与冰冷相结合的低温送风系统,分析了低温送风系统带来的经济效益、低温送风系统的室内热环境以及人体的热舒适性。指出了与冰蓄冷相结合的低温送风空调系统在中国的发展
根据写作风格来识别作者这一问题在国外很早就已经开始研究了,并有很多成功应用.而针对中文的研究却非常少.本文首次提出了使用文章中虚词频率分布作为特征来研究这一问题,采