藏文自动分词中未登录词处理方法研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zjpjwxd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文中后接成份出现频率较高,分词中未登录词的后缀单切现象会影响分词的正确率,为此,采用词(语素)+缀归并的方法,将藏文后接成份与前一词(语素)归并为一个切分单位输出。针对藏文中大量人名、地名、单位名等未登录词在分词时出现的碎片切分现象,使用分词碎片整合方法,将多次出现的词条碎片整合为一个切分单位输出。实验结果表明,2种方法能提高藏文自动分词的识别正确率。
其他文献
现有软件胎记系统仅对程序属性进行粗略选取,导致系统性能不理想。为此,提出一种基于互信息的k-gram软件胎记选取算法。构建受保护软件的变体软件以及功能相似的软件组成的软件
Based on the analysis of the common limitations of business process management (BPM) methodologies and the requirements of small and medium sized-enterprises (S
行人检测系统难以同时具有高检测率、低误报率和较快的检测速度。为解决该问题,提出一种基于快速级联分类的行人检测系统。该系统包括预处理和分类检测2个部分,在分类检测阶
针对自修复密钥分配方案无法恢复前面多次和最后一次会话密钥的不足,提出一个基于访问多项式且适用于移动Ad Hoc网络的互助修复密钥分配方案。该方案采用访问多项式、双向哈
以N,N-二甲基乙酰胺(DMAc)为溶剂,加入LiCl和CaCl2制备2种溶解体系,研究了间位芳纶纤维在2种溶解体系中的溶解性能及芳纶溶液的静电纺丝性能。间位芳纶纤维在N,N-二甲基乙酰
复合垂直流人工湿地在处理低碳氮比值污水时需外加有机碳源,增加了处理成本,且存在二次污染的可能。将单质硫与CaCO3以体积比为1∶1均匀混合后作为基质填充到复合垂直流人工
<正>据《低温技术》杂志报道,在英国液氮被用来杀灭房间里的螨虫,使虚弱患者症状减轻。最近BOC公司研制成功与特殊设计的吸尘器配用的液氮喷嘴,来处理地毯和室内装璜,该系统
期刊
生态保护红线的划定对于规范人类活动、控制人类活动强度、维护生态安全和保护生态系统功能的可持续性具有重要意义,生态系统服务评价是其中重要的一环。由于我国地域面积广
According to traditional phenomenological fatigue methodology and modern continuum damage mechanics theory, dual fatigue cumulative damage rules to predict fati
本文指出,《社会主义"有点潮"》是讲好中国特色社会主义故事的一次成功探索,认为节目揭示了中国特色社会主义是人民的选择,始终坚守着以人民为中心的价值取向是社会主义之所