藏文词库自扩充学习算法的设计与实现

来源 :高原科学研究 | 被引量 : 0次 | 上传用户：pollyzhang15

【摘要】

：

在自然语言处理过程中,词库的大小直接影响着快速输入、信息检索和文本相似度对比等一系列工作的准确性和效率。目前,藏文词库建设主要靠人工扩充方法,未见藏文词库学习算法

【作者】

：

严李强周建朋冯郅皓

【机构】

：

西藏大学工学院,西藏大学信息科学技术学院,西藏金橘智能科技有限公司

【出处】

：

高原科学研究

【发表日期】

：

2019年3期

【关键词】

：

藏文词库扩充自学习算法 TibetanLexicon ExpansionSelf-LearningAlgorithm

【基金项目】

：

国家自然科学基金项目(61561045),西藏大学青年科研培育基金项目(ZDPJZK1705).

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在自然语言处理过程中,词库的大小直接影响着快速输入、信息检索和文本相似度对比等一系列工作的准确性和效率。目前,藏文词库建设主要靠人工扩充方法,未见藏文词库学习算法的研究或文献。文章设计了一种通过遍历藏文文本音节字并识别和统计每个词,将达到阈值的词添加到藏文词库中的算法。经测试,该算法在词库扩充方面具有良好的效果。

其他文献

浅论诵读法在讲授文言文中的具体步骤

阅读它既是传统的，也是现代的；既是语感的，又是技能的；既是文学的，又是审美的。所以它是语文教学的一大法宝，是提高学生语文与人文素养不可或缺的教学手段。因此我们要重视阅读的训

期刊

范读初读研读背诵

青海玉树灾后重建项目力推民生工程

自6月份以来，以结古镇居民住房重建为重点的重建项目进展明显加快。截至目前，累计开工城乡住房、公共服务、市政建设、产业、生态等重建项目471项，今年新开工287项。

期刊

灾后重建青海工程民生玉树居民住房公共服务市政建设

无创正压通气治疗慢性阻塞性肺病合并Ⅱ型呼吸衰竭35例疗效观察

目的探讨无创正压通气治疗慢性阻塞性肺疾病（COPD）合并Ⅱ型呼吸衰竭的疗效。方法选择两年来收治的35例COPD合并Ⅱ型呼吸衰竭患者，在常规治疗的基础上应用无创正压通气治疗，观察患

期刊

慢性阻塞性肺病呼吸衰竭无创正压通气

运用整合营销传播理论提升证券公司竞争力

2006年是中国证券发展史上重要的一年,持续上涨的股指直接刺激了投资者的信心,越来越多的投资者通过各种渠道参与到资本市场的繁荣中来,网上证券交易成为重要的交易方式。随

学位

整合营销传播客户关系管理网上证券

一种快速排序筛选SAR图像目标CFAR检测算法

传统SAR图像目标CFAR检测算法通常针对低分辨率图像,目标在高分辨率图像中表现为扩展目标时难以获得较好的检测性能.为解决高分辨率SAR图像的目标检测问题,借鉴3种传统CFAR检

期刊

恒虚警率合成孔径雷达图像目标检测排序筛选

全球乳胶医用耗材市场预计在2024年将价值64亿美元

透明度市场研究公司（Transparency MarketResearch）近日发布报告称，乳胶医用耗材市场大多较为分散，前五大公司在2015年占比略高于60％。这五大公司包括Top Glove Corporation、Anse

期刊

市场份额医用耗材乳胶价值预计技术进步产品范围透明度

断裂现象揭示橡胶结构和特性的真相第6部分橡胶增强的真实结构和广义概念（二）：交联天然橡胶应力增加的实质

真实交联橡胶中的交联相，表现为高斯分布状态，而并不是非高斯状态。交联橡胶的应力增加和拉伸强度提高，是通过其中非交联相的共连续结构来实现的。在温度低、拉伸速度快和高伸长

期刊

交联橡胶天然橡胶橡胶结构橡胶增强断裂现象应力广义特性

对小学自然“探究——发现——创造”教学模式的探索

期刊

小学自然教学模式陈晓东太阳高度技能训练课

物联网与GIS技术在文化遗产保护中的应用

从数字地球到智慧地球$$ 1998年1月31日，美国副总统戈尔发表了题为“数字地球:21世纪理解我们行星的方式”的报告，首次提出并系统阐述了“数字地球”的概念，指出数字地球是一

报纸

论行政许可监管不力的法律救济

行政许可制度究其根本,体现的是国家对特定领域的管理控制以及公民、法人或者其他组织生产创造的自主性的平衡。行政许可的设置关系到公共安全、社会秩序,也关系到人民群众生

期刊

行政机关行政许可监管法律救济

藏文词库自扩充学习算法的设计与实现

与本文相关的学术论文