知识图谱的分布式存储及知识查询技术研究

被引量 : 0次 | 上传用户:xianyekong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱将文本中的知识进行提取,用节点表示实体或概念,用节点之间的连线表示关系,以图的形式构建了一个关系网络,为研究者提供了“关系”的视角来分析和研究问题。本文针对以下问题:首先,采用单节点存储知识图谱已经难以适应当前大规模知识图谱的存储需求;其次,分布式环境下的频繁子图挖掘存在复制图过多、本地频繁模式规模远大于全局频繁模式规模的问题;最后,常见的朴素匹配算法在知识查询过程中需要检索过多的列表,导致时间复杂度过大的问题。主要研究工作如下:1.构建了一种基于HBase分布式知识图谱存储模型,选用基于Hadoop的分布式存储方案帮助提高数据的可伸缩性。设计了一种基于迭代Map Reduce的频繁子图挖掘算法。首先对嵌入已经候选生成子图的顶点与边的可能扩展信息,再与新生成的候选子图进行同构检查,从而解决了复制图过多的问题。通过将该轮Map Reduce输出的全局频繁子图集合作为下一轮迭代Map Reduce的输入,从而解决本地频繁与全局频繁的问题。2.考虑到知识查询中各类模式都至少包含一个想要提取的(S,P,O)关系的一个元素的信息,因此提出基于哈希表预查询的检索加速。由于哈希表的时间复杂度为O(1),所以相当于在查询之前进行了一次常数时间复杂度的预查询,同时减少整体的检索时间。3.采用哈希表对Map Reduce模型进行优化,减少中间结果产生的碎片,同时保证Map函数和Reduce函数接口的属性不受影响,提高系统整体运行效率。基于本文提出的方案,实验过程中采用五种不同规模的LUBM测试数据集与八种不同的SPARQL查询语句进行实验,并与其他知识图谱存储方案进行对比实验。最终经过实验证明本方案知识图谱存储空间有所降低及知识查询所需时间有所缩短,提高了知识检索效率。
其他文献
目的:概述了电梯维保及其质量评价领域的研究历程与研究热点,并对未来的研究发展方向进行预测与展望。方法:使用文献计量分析法,首先综述了电梯维保领域的研究现状,从发展趋势、出版刊物、热点词分布等方向进行分析,梳理电梯维保领域发展历程,并归纳总结电梯维保领域的研究热点。其次,从电梯维保质量评价的定义与对象出发,对电梯维保质量评价领域的指标与评价方法进行分析。最后,系统总结电梯维保质量评价研究现状与面临的
期刊
以稀土熔盐电解渣为原料,提出了磁选—焙烧—浸出工艺提取稀土元素。全过程工艺考察结果表明,原料在100 mT的最佳磁场强度条件下,除铁率达到45.59%,非磁性相在焙烧浸出过程的最佳工艺条件为:焙烧温度750℃、CaO添加量30%、浸出温度25℃、盐酸浓度3 mol/L,全过程工艺的Nd、Pr的总回收率分别达到95.98%、96.15%。采用原位XRD表征结合热力学分析,明晰了焙烧过程矿相转化规律,
期刊
知识图谱是一种结构化的知识存储方式,高质量的知识图谱能够为许多人工智能任务赋能,例如智能问答,推荐系统等。然而,由于现实世界的知识的规模非常庞大并且在不断增长,现有的知识图谱往往是不完整的且非常稀疏的。因此,如何设计知识图谱自动补全的算法成为当下的研究热点。知识图谱补全目前存在以下挑战:1、知识图谱中的关系存在复杂的逻辑语义,造成了补全实体间的链接存在挑战性;2、知识图谱中的许多实体的类型同样需要
学位
推荐系统作为一种帮助用户缓解信息过载问题的主要手段,其性能往往由推荐的有效性、可解释性和多样性等多个方面共同决定。结合知识图谱与图神经网络从而提升推荐性能已成为当前研究热点。尽管目前最先进的结合知识图谱和图神经网络的推荐模型KGCN的推荐性能已经达到了不错的效果,但是尚未对用户端进行建模,限制了推荐有效性的进一步提升,并且没有充分利用知识图谱中节点之间的高阶连通性,导致推荐结果的可解释性较差。因此
学位
随着新一代人工智能的提出与高速发展,认知智能成为了当前研究的热点,知识图谱作为知识的容器,为智能应用提供了知识组织管理与应用支撑服务,成为认知智能发展的核心。知识图谱描述包含若干客观事实的真实世界,但由于其构建过程的局限性(大部分由手工构建或半自动化构建),存在大量缺失知识,许多隐含知识没有被发现。因此,利用知识图谱补全技术发现隐含链接,补全缺失知识,具有重要意义。知识图谱补全指基于图谱中已存在的
学位
先天性腓骨缺如(Congenital Absence of Fibula)是一种罕见的先天性长骨缺如性疾病,目前为止该疾病发病机制尚不明确,现多认为其发病原因是由于基因突变或染色体缺失等导致,从逻辑推理,该疾病为先天性疾病,多认为其缺如的形成应起源于胚胎发育时期(即孕4-6周),临床上主要表现为肢体短缩、马蹄足畸形、随着机体逐渐发育可能出现胫骨弯曲,踝关节缺如则可能会出现足内翻或外翻畸形,甚至由于
期刊
为提升电梯维保企业无纸化办公程度,开发了一个“电梯维保抽查”微信小程序客户端,介绍了微信小程序的前端开发流程,应用input、button、radio、picker等标准控件,编写了相应的软件代码,方便了电梯维保企业维保抽查工作的记录和汇总。
期刊
收集、整理归类稀土冶炼中萃取槽搅拌系统容易出现的7种故障,针对搅拌系统常见故障,在萃取槽搅拌系统的结构形式、制造工艺查找故障原因,从选材、结构设计、安装要求等方面提出改进泵轮式搅拌系统的方案,并取得良好的应用效果。
期刊
为研究钢板加固后陶粒混凝土梁的抗弯性能,对1片未加固的对比梁和3片厚度分别为0.5 mm、1.0 mm、1.5 mm的钢板粘贴加固梁进行抗弯试验。试验结果表明:与未加固陶粒混凝土梁对比,适筋条件下粘钢加固陶粒混凝土梁的开裂荷载、极限荷载最多分别能提高91.3%、39.5%;加固梁与未加固梁的破坏机理与破坏形态相同;钢筋与钢板的应变发展规律基本一致,钢筋与钢板协同作用效果较好,且钢筋应变表现出一定的
期刊
文本自动生成旨在根据已有信息生成可读的文字表述,在智能问答系统,新闻的自动撰写与发布,学术论文撰写等场景中有广泛应用。为了更好的表示信息之间联系,现有很多文本自动生成方法利用知识图谱实现文本生成过程。然而,现有图谱到文本生成方法仍存在以下问题:(1)没有挖掘图谱中节点之间的隐藏联系,导致捕获图谱信息不完整;(2)在模型训练过程中没有对生成文本进行准确评估和指导模型训练,导致生成文本存在信息偏差;(
学位