基于Wikidata和标签云的搜索算法研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:abc16900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识库是一种结构化、易于操作、有组织的知识集群。针对Wikidata这一开放知识库的内容及结构,提出一种构建标签云的方法,对信息进行标签化处理,并将转换得到的标签向量应用于信息检索和页面排序。首先,提取Wikidata中的结构化数据,构建以实体为单位的标签云;然后,将需要检索的文档和用户的检索语句映射为相应的标签,并采用处理向量的相关方法实现网页的排序算法;最后,采用信息检索常用的标准对该算法进行验证。实验结果表明,与传统的基于关键词的搜索方法相比,新算法在一定程度上能够提高页面排序的准确率。
其他文献
比较蛋白质组学是蛋白质组学的一个重要分支,现已广泛应用于生命科学和医药学的各个领域,尤其在重大疾病研究、治疗和靶向药物的筛选方面得到了更为广泛的应用。比较蛋白质组
针对数字图书馆网站区别于普通网站的特点,从数据安全的角度发现电子文献数据面临的风险,分析其根本原因,探讨应对风险的方法和策略,希望能够引起数字图书馆建设者对电子文献
规范IETM信息标准是IETM的前提条件,而IETM的核心是数据格式。为了便于IETM的使用和管理,需要对IETM数据格式进行规格处理。很多国家和地区基于本国国情创立了IETM技术标准,从而
目的食管癌(esophageal cancer,EC)组织中lnc RNA DNAJC3-AS1的表达及其与临床病理特征的相关性研究。方法选取2017年6月~2019年5月宝鸡市人民医院收集的246例EC患者的肿瘤组
在近一些年来,我国越来越重视人才的全方位培养,这就需要对体育教学开展改革计划,进而起到丰富体育教学的目标。而扩展训练是一种较为常见的体育教学方式,它能够提高学生的身
我国正处于社会转型的重要阶段,注重学生的综合素养提升,已经上升成为国家的重要战略发展目标。培养青少年全面发展,最根本是智力、体力和道德的充分、统一的发展。本文针对