藏文信息处理相关论文
随着自然语言处理技术的快速发展,藏文信息处理技术也取得了较大进展。其中,藏文舆情分析作为藏族地区社会舆情分析的重要技术,受到广......
随着计算机技术的快速发展,藏文信息技术处理的水平也在阔步前进,藏文数字化工作的快速推进以及藏文信息技术各类应用的日益普及,使藏......
双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,......
藏文字构件分解是藏文信息处理的基础,具有重要的理论价值和广阔的应用前景.针对藏文字构件的复杂性与多样性,文章通过分析现代藏......
办公套件是人们日常应用最为广泛的信息处理软件之一,但真正意义的藏文办公套件至今都尚未问世,成为藏文信息技术发展的“瓶颈”.......
句子边界识别是藏文信息处理领域中一项重要的基础性工作,该文提出了一种基于最大熵和规则相结合的方法识别藏语句子边界。首先,利......
针对为汉藏辅助翻译系统建立汉藏多词单元翻译词典这一任务,该文提出了CMWEPM模型。该模型首先依据关联度和结合度来确定汉语语料......
该文提出了一种简单、快速的藏文网页文本分类方法。该方法利用网页栏目中词条的类别特征,结合网页文本提取技术,实现了快速、精确......
在自然语言处理中,词类划分属于基础研究,其重要性不可忽视。本文以小学藏语文教材为语料,利用计算机对教材中藏语词的频次,数量等......
摘要:藏文文本关键词在文本聚类/分类、自动摘要、信息检索等领域具有重要地位,然而当前互联网上的藏文新闻网页几乎没有提供关键词......
藏文分词是藏文自然语言处理的基础。根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计......
藏文词性自动标注是藏文信息处理后续句法分析、语义分析及篇章分析必不可少的基础工作。词性歧义问题的处理是藏文词性自动标注的......
介绍了"藏文政府办公系统研发"项目的研制情况,以及系统的目标定位、体系结构、功能特点、技术路线和藏文化关键技术实现原理等内容.......
藏文词典查询算法是藏文信息处理的一个重要的基础部分,对系统的效率有重要的影响.提出一种快速自适应编码查询算法来指导藏文字、......
藏文音节构件识别是藏文信息处理应当特别关注的一个问题,要实现藏文排序、藏文拉丁转写、藏文文本校对等工作就必须先识别出构成藏......
计算机学院创建于1987年,其前身是黄石高等专科学校计算机与信息工程系,经过二十多年不断的努力和发展,已由创办之初的一个专业(计算机......
文中通过分析藏文文法,提出了自动分解现代藏文字构件的方法,其基本思想是:利用藏文文法将藏文字分解为基本构件和组合构件,并通过......
微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与......
音节字的排序是藏文字词排序的基础,但目前还没有统一的规范标准。本文对《新编藏文字典》中任意部首内部的音节排序做一种同一而......
藏文字有着独特的构字规则,组字部件的自动识别在藏文字、词、句层面的信息化处理有重要的应用。文章提出的藏文字部件自动识别方......
同其他语言一样藏语词性的兼类现象普遍存在,这给词性标注工作带来了巨大困难,对兼类词的处理是藏语词性标注的关键所在。文章利用......
藏字内码向ISO/IEC 10646-1藏文编码过渡是实现计算机用文字编码统一的必然趋势,但目前在很长的一段时间内仍将存在多种藏字编码并......
藏文中后接成份出现频率较高,分词中未登录词的后缀单切现象会影响分词的正确率,为此,采用词(语素)+缀归并的方法,将藏文后接成份与前一词......
随着藏文信息技术的发展和进步,藏文字处理技术已经日趋成熟。其中UNICODE藏文编码国际标准的公布和OPENTYPE技术在藏文字体设计上......
语音合成是人机交互的核心技术之一,也是中文信息处理中的一个难题。语音合成的目标是将文字信息自动转换为清晰、流畅的语音,它的......
藏文拉丁转写是研究藏文化和进行藏文术语交流的重要工具。介绍了一种基于藏文编码字符集基本集和藏文编码字符集扩充集A,实现藏文......
藏族民间的骰子游戏布局新颖,玩法独特,逻辑复杂,具有很强的策略性和娱乐性,是民间最常玩的一种游戏,堪称民间游戏的经典。文章主......
纵观藏文信息处理40多年的发展历程,目前已经从藏文的“字”处理开始跨入“词法、句法、语用、语篇”等处理的研究领域,所以藏文信......
在分析现有藏文自动分词方法的基础上,针对藏文分词系统中虚词识别的难点进行深入研究。根据传统藏文文法,描述了藏文虚词在文本中......
二十世纪九十年代以来,以计算机和通信技术为核心的信息技术迅猛发展,在社会各个领域引发了深层次的变革,加速了人类迈向信息社会......
该文结合链楼分析技术和藏文编码识别技术,使用网络爬虫实现对互联网上藏文文本资源的挖掘,分析了Web藏文文本资源的分布情况.统计......
要让计算机来识别藏文短语,则首要的条件是人类先要找出藏文短语的语法规则。凭借着这些规则从真实语料当中找到并提取和分析藏文......
词义消歧是词语语义分析的重要内容,也是整个自然语言处理研究中的一个值得关注的问题,对机器翻译、信息检索、舆情监测等各项高层......
藏文自然语言处理始终都无法离开现实语言的支撑,让计算机懂得并理解藏语也离不开不同颗粒度层面上构建的知识库、规则库和藏语语......
藏文信息处理研究可分为应用研究和基础研究。近几年,藏文信息处理在应用研究方面出现了喜人的局面,其相应的研究成果都在网络资源......
藏文词性标注是藏文信息处理技术中的一项基础性课题,它的研究成果不仅为机器翻译、搜索引擎、网络信息安全等诸多领域的研究奠定基......
该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资......
该文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提......
藏文信息处理是以计算机为主要工具,以藏语言文字为处理对象的高新技术。藏文信息处理技术近二十多年的发展过程中,国内外已经开发出......
运用计算语言学的相关研究,提出构建藏语动词语法信息库的方法、收词原则及其词条的来源,以及藏语动词在〈藏语动词语法信息库)中的分......
针对从互联网获取的一份包含19万藏文网页,总计427万句、9 328万音节字的藏文文本语料,该文按照预定的规则对其中的藏文音节拼写错......
文本自动校对在自然语言处理领域中有着广阔的应用前景.文章通过比较分析国内外文本自动校对系统的发展现状,提出了设计现代藏文文......