大规模RDF知识图谱的分布式存储与索引方案研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:woyaopojiemimaya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱在描述现实世界中的各种实体和关系方面具有良好的表现形式,它是人工智能领域的一项关键技术,研究热度随着人工智能的发展而不断提高。作为描述大规模知识图谱的标准数据格式资源描述框架RDF,伴随着知识图谱的兴起,也广泛应用在各个领域,与我们生活息息相关。例如,用于帮助搜索引擎找到更符合用户需求的答案、用于优化对一个事物的具体描述。RDF数据的广泛使用导致其数据日益庞大,亟需一个高效的数据管理系统进行有效管理。但是目前无论基于关系或基于原生的RDF数据管理系统,多为在单机系统实现或依赖过度的存储开销达到快速管理的要求,不足以满足数据发展现状的需求。为此需设计一种针对RDF数据基于分布式环境的优化型方案。本文提出了一种名为RDFSIS的RDF知识图谱数据的分布式存储与索引方案和一种与之对应的名为QOS的查询优化策略,目的是在分布式系统上以适度地存储开销达到对庞大RDF数据的高效管理。RDFSIS方案为三种方法的组合,包括提取关系构建实体索引、本体划分和连接分类处理,通过这些方法抽取数据实体之间的关系、构建实体类索引;处理实体内部数据,构建谓语索引,加强实体内部数据的关联度;使用连接,降低数据操作复杂度,将数据最优存放。QOS策略包括查询谓语定位算法和查询执行优化处理算法,通过索引指向缩短数据检索的范围,修改查询减小数据的连接复杂度,提高数据检索速度,从而保证RDF数据管理系统综合性能的优良性。通过对比实验,在合成数据集和真实数据集上分别验证了本方案的可行性。在不同类型的数据集、不同规模的数据、不同类型查询上的大量实验数据均显示本方案有优化效果,查询效率高于原系统,从而证明了本文的方案在大规模分布式系统上对于RDF知识图谱数据的真实可用性。
其他文献
随着BIM理念与BIM技术在我国各领域的应用愈发广泛与普及,对BIM技术的理论与实践研究也逐渐开始向建筑后期的运维管理领域延伸。在建筑设施运维管理阶段应用BIM技术,有助于提高建筑信息的使用效率,同时也有助于提高运维管理工作效率。而我国当前对BIM技术应用于建筑设施后期的运维阶段的管理与应用研究尚处于初期阶段,如何将BIM技术深度融合至运维管理的流程中去尚需要不断的探索与研究。当前,教育信息化2.
设施管理(Facilities Management)能够为建筑提供高品质的环境并提高投资效益。其管理范围包括资产管理、安全管理、设施设备管理等是项目全生命周期运营维护阶段的重要管理方法。传统的设施管理模式因为对信息保存难度大容易产生信息孤岛的问题,难以发挥应有的作用。随着近年来建筑信息模型(Building Information Modeling)在国内建筑行业的应用有了很大的发展,有人提出将
在产品创新设计研发过程中,用户需求研究是最基础也是最核心的一部分。用户需求产生于人的欲望,由欲望引发用户动机,并体现于用户与产品或系统的交互——用户体验的过程中。用户体验是动态的过程,随着用户、场景与产品状态的改变,相应的用户对产品的需求也会发生变化。因此,用户需求识别/挖掘研究与用户体验的过程密不可分。在发达的互联网环境下,在线用户评论数据内容丰富,且蕴含着大量用户信息,是获取用户需求的重要数据
AR(Augmented Reality)技术,即增强现实技术,是一种基于真实环境实现虚拟信息叠加的数字技术。随着新媒体与数字时代的到来,纵观国际大环境,AR技术已凭借着虚实结合与实时交互优势逐渐在建筑遗产展示领域得到诸多探索与应用实践,我们也有必要在系统学习、分析借鉴这些实践经验的基础上,针对中国建筑遗产的特点与价值,探索AR技术可以为中国建筑遗产带来的展示方式。此次研究是一次新思维与数字技术视
药物研发耗时费力成本高昂,药物重利用是解决问题的重要途径,其中药物-疾病的关系预测是药物重利用中的研究热点。早期的方法主要是基于文本挖掘的关系链接预测的相关方法,但是无法考虑疾病的潜在机制。为了更好地处理和分析疾病机制中的复杂关系,网络模型被应用到药物-疾病相互作用关系预测研究上。现有的基于网络模型的关系预测方法虽然考虑了复杂关系的整体性,但却忽略网络中的节点差异性。另一方面,现有模型大都采用是以
随着当前互联网环境中各类社交媒体的快速发展,人们在互联网上留下了海量的电子足迹信息,这些信息包含了人们的社会言论、社会关系、社会行为等丰富数据。这些数据为我们构建用户画像,分析社会关系提供了重要的数据支持。社会关系是人类社会的重要组成部分,社会关系分析是社会网络研究的重要基础。传统的社会关系分析研究多倾向于关系的方向、强度和类型,缺乏丰富的语义内涵,因此这些方法所构建的关系画像存在局限性,难以支撑
在信息检索中,最近的研究表明,信息检索系统的平均有效性的提高可能会降低信息检索系统在多个主题的得分的稳定性,这个现象表明有效性和稳定性两者之间存在一个折中。另外,一些风险指标被提出来度量系统的风险,但是这些评价指标是与前面所提到的有效性评价指标是分开定义的。综上所述,目前信息检索评价领域主要存在三个问题:(1)系统的有效性和稳定性尚未在一个统一的框架中进行系统的评估;(2)在这个框架下,这个统一的
目前关于人脸面部表情的研究主要是对静态人脸图片直接分析识别,这种方法往往在实验室环境下的人脸数据集上表现不错,却难以适用于含有有损人脸的野外复杂环境下的人脸数据集,比如低分和有部分遮挡等人脸图片。本文旨在通过人脸修复模型对有损人脸进行修复生成,然后利用人脸面部表情识别模型对修复后的人脸进行面部表情动作单元识别分析。本文主要解决的问题是保证修复生成后的人脸图片的人脸面部表情动作与真实的人脸面部表情动
校园暴力和欺凌已经成为严重影响青少年健康成长的问题之一。目前的预防措施主要依靠个人主动揭发或者学校监督。到目前为止,还没有一个有效的解决方案能够自动检测出暴力欺凌事件。检测暴力欺凌事件的本质就是人体行为识别。目前,人体行为识别在教育、医疗、商业和军事领域已经有广泛的应用。而且,人体行为识别在计算机视觉、可穿戴传感器和基于环境传感器技术方面都有一定的研究。但是,这些技术都有一些设备,场景的限制,无法
三维钻孔可视化是钻孔设计中的重要方面,旨在更形象的展示钻孔的内部结构,方便用户的设计,具有一定的现实意义。本文对三维空间展示相关理论进行了研究,并对系统需求与系统的主要开发技术进行了深入的分析。确定以MVC开发模式为基础,采用Beego框架以及Mongo DB数据库,结合HTML5、Web GL和Java Script等前端可视化技术实现系统功能设计与界面设计。系统划分为计划钻孔展示、实际钻孔展示