多级索引的藏语分词词典设计

来源 :计算机应用 | 被引量 : 6次 | 上传用户:hxlatxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏语分词词典是藏语自动分词系统的重要基础,词典规模大小和算法设计的优劣直接影响着分词的效率。本项目首先收集了多部藏语字、词典的所有词条及藏语标点符号,形成了约10万词条的大型藏语分词词库;根据藏字不同长度的特点,建立了藏语特有的多级索引分词词典机制,分析设计藏语整词二分法进行藏语分词。实验结果表明该藏语分词词典具有结构简单,分词速度快和查询性能高等优点。
其他文献
分析了现有的基于身份的盲签名和代理签名,发现这些系统都需要无条件信任私钥产生中心(PKG)。因为PKG可以计算系统内任何用户的私钥,当然可以伪造任何用户的盲签名和代理签名。在已有基于身份无可信中心签名的基础上结合基于身份的盲签名提出了一个基于身份无可信中心的盲签名,同时提出了一个基于身份无可信中心的代理签名。分析表明,所提出的盲签名和代理签名是安全有效的。
VX939是昂达最近推出的一款全不锈钢设计的MP3彩屏播放器。外表光滑通透.手感不错。它采用炬力ATJ2097芯片,外形尺寸为66mm×38mm×13mm。重量约56g,分512MB和1GB两种闪
重点介绍了染色体畸变、淋巴细胞微核、早熟凝集染色体和荧光原位杂交以及HPRT基因突变、GPA基因突变、TCR基因突变、HIA—A基因突变、小卫星DNA位点突变和线粒体DNA缺失等方
目前,国内已利用纳米微粒稳定地分散在涤纶或其他合纤的纺丝液中,然后纺出具有防紫外线、抗菌、防臭和消臭、远红外反射或吸收红外线等功能的合纤。在印染和后整理,采用涂层,浸轧
头面部在生产作业中容易受到化学腐蚀性物质的伤害,由于组织结构的特点,损伤往往较重,并发症较多,治疗困难。现拟就我院收治的头面部化学灼伤病员的情况总结报告如下。1临床资料我
手指触摸到键盘、眼睛看着屏幕,就会产生习惯性地心慌,很想往论坛灌点什么,很想在QQ上聊点什么。就这样,爱上键盘发出的清脆声音,爱上手指优雅的起伏,停顿,爱上魔鬼般的网络……网络
大规模P2P稳固冗余存储方案是当前存储研究领域的研究热点。从存储组织结构和数据维护机制两个方面出发,重点比较了完整模式、编码模式和混合模式的数据存储特点;并在分析不同数据维护机制的基础上,提出一种具有失效置信度的数据延时维护策略。通过仿真实验验证了不同存储模式下的维护机制有效性和相关指标。