面向知识图谱的语义相似性图查询方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:lulei81331502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱对现实世界中的实体、概念、关系等客观事实进行建模,以图的形式表示现实世界中各个领域的知识。其中,实体、概念作为知识图谱图结构中的节点,它们之间的关系则作为知识图谱图结构中的边。目前国际上知名的开源知识图谱主要有DBpedia,YAGO,Freebase等。如何针对知识图谱进行有效查询以获取相关信息是当前的研究热点,其研究成果可应用于智能问答、推荐系统等领域,具有重要的研究价值与意义。图查询是实现知识图谱有效查询的主流技术之一。如何实现一种高效的图查询方法是实现知识图谱有效查询的关键。现有图查询方法通常基于结构相似性进行子图匹配,忽略了知识图谱中丰富的语义信息,导致查询结果不完整,影响查询精度。此外,图查询方法大多针对全图进行处理,在知识图谱规模较大的场景下将严重影响查询效率。针对上述问题,本文主要从以下几方面展开研究:(1)面向领域的知识图谱子图挖掘。首先对原始知识图谱数据进行适当的预处理,以消除噪音数据并完成数据标准化。在此基础上,提出领域子图挖掘算法,在图遍历的过程中结合类型相似度将知识图谱划分为多个领域子图。领域子图之间相互独立,有利于实现分布式的存储,提高查询效率。(2)基于领域子图的知识图谱存储架构。在领域子图的基础上设计并实现一种基于邻接表和跳表索引的存储架构,以领域子图为基本存储单元对知识图谱进行有效存储。在此基础上,实现了高效的图数据基本操作方法,如数据的插入、删除、更改、查找,实现了对领域子图的有效管理。知识图谱的有效存储与管理为后续语义相似性图查询算法的研究提供了可靠的底层数据支持。(3)基于语义相似性的图查询算法及优化。首先利用图嵌入模型将谓词映射到多维向量空间中并计算谓词语义相似度,据此构建动态语义图。在此基础上,提出一种语义相似度启发式估计函数,并设计基于A*算法的语义相似性图查询方法,通过对路径语义上下界的有效剪枝可大幅提升查询速度。最后,对语义相似查询算法进行时间约束下的查询优化,通过不断迭代早期探索的结果集和预估查询时间,来确保在用户时间约束内返回尽可能相似的匹配查询结果。最后,基于上述理论研究成果设计并实现了知识图谱语义相似性查询原型系统,并通过大量实验证明研究成果和系统的有效性与可用性。
其他文献
随着万物互联互通时代的到来,准确、可信、高度可用的网络时间是所有网络应用场景正常运行的基础。利用网络传递时间信息的方式吸引了越来越多的关注。网络时间同步不需要额外的同步设备便能够满足绝大多数业务时间同步的需求,具有成本低廉、应用广泛以及方便快捷的优势。另外,伴随着网络应用场景的多样化增加,催动着网络时间同步对可靠性、高精度等等的需求。本文意在搭建一套互联网时间服务监测系统,持续监测世界范围内互联网
用户兴趣爱好建模是推荐系统中的研究热点,它要求从用户的购买记录中准确识别用户的兴趣爱好并精确提取相关兴趣特征。用户兴趣爱好建模的结果直接决定推荐系统后续的决策,因此,如何从用户交互数据中提取出用户兴趣爱好成为一个十分有价值的工作。其中,用户行为序列和评论信息是用户交互记录中的两种重要数据信息。用户兴趣爱好建模根据预测的目标不同可以分为两种。一种是评分预测,预测用户对未购买商品的评分。评分是精确的数
粮食是任何国家不可或缺的经济物资和战略物资,粮食安全关系到国民经济发展安全和国家社会安定团结,越来越受到各个阶层的广泛重视。我国作为传统的农业大国和拥有14.5亿民众的人口大国,储粮备荒是长期以来保障人民口粮存续的实践经验。在我国粮食储备中,政府储备粮占有了绝对的调控优势,在平衡全国粮食总供需,维持粮价平稳,应对突发灾害等方面发挥了重要的作用。如2020年我国爆发新冠疫情期间,武汉市在暂停全市生产
我国物有所值评价由于数据积累不充分、评价方法不完善、政府主导评价等原因,导致评价有待完善。为此,国家建立了财政部PPP项目库,旨在为各行业提供数据挖掘和分析的基础,目前,针对物有所值评价数据分析利用的研究还比较少,尚未形成成体系的研究思路。为了探究物有所值评价数据的研究利用方法,分析实操过程是否与国家政策导向和理论相符,本文对财政部PPP项目库中297个黑臭水体治理项目数据、对中央国务院和国家部委
如今网络科技的飞速发展同时也伴随着网络空间安全问题的层出不穷,但是传统网络攻击防御方案无法应对呈现复杂性、多元化的新型网络攻击手段,从而导致严重的网络瘫痪和经济损失。以攻击威胁信息数据为核心的网络威胁情报技术的出现,为日益紧张的网络空间提供了安全防御保障。对新型攻击手段如高级持续性威胁(Advanced Persistent Threat,APT)和恶意软件攻击等有组织有规划的攻击手段,需要安全防
在交通越来越发达的现代信息社会,随着车辆数量的增加,人们对智能交通的需求越来越高。为了满足智能交通的需求,在交通网络中引入了物联网的思想。车联网通过信息交流和网络
钢结构行业是劳动力、资金密集的传统制造业与装备、技术的新型制造业相汇而成的钢材深加工制造与安装工业。随着钢结构行业的迅速发展,培养高素质、高技术综合型技术人才,已成为解决钢结构行业人才短缺和劳动者素质不高的当务之急。技术人才的培养是行业发展、技术提升的基础工作。完善培训体系有利于提高员工的文化素质、技术能力,提高企业的技术实力、竞争实力,促使企业战略目标的实现,也能够助力工人找到发展方向,达到工人
随着全球环境变化以及各种发展过程中问题的出现,人类为了追求经济发展和生态环境相协调,可持续发展的理念因此出现并不断获得充实与发展。其中,教育是促进可持续发展、提高人们可持续发展意识和行为的关键,幼儿教师作为为幼儿发展奠基的专业教育工作者,首先自身就应该具备科学的可持续发展观念,这样才能有助于引导幼儿正确认识环境、社会、经济等方面的内容,提高幼儿可持续发展意识,促进幼儿可持续发展。本研究选取兰州市某
近几年,随着定位技术的大规模使用,LBS(Location Based Services,基于位置信息的服务)需求日益增加,室内外信息化程度不断提高,同时室内外定位技术还拥有着巨大的商机,使得室内外定位技术的相关研究越来越受重视,成为许多科研人员的热门研究。如今,室外定位技术已经成熟,而室内定位技术并没有成熟的解决方案,根据社会发展的需求,LBS已经在智慧城市、智慧海洋、智慧物流以及道路辅助与导航
《中国制造2025》提出把可持续发展作为建设制造强国的重要着力点。全面推行清洁生产构建绿色制造体系,应围绕绿色技术创新构造与生态环境系统相协调的新型的现代技术体系。随着命令控制型环境规制的不断加强,我国逐渐引入了旨在减少环境污染的自愿型环境规制的办法。其中作为一种自愿型环境规制的环境管理体系认证(ISO14001)是由第三方权威机构对企业实施评定从而颁发的证书,企业纳入环境管理体系认证有效的显示企