基于SHACL的知识图谱增量式验证

来源 :天津大学 | 被引量 : 0次 | 上传用户:cx2cx2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着知识图谱的不断发展,RDF图数据规模也急剧扩大,越来越多的RDF数据的应用对RDF图数据的质量提出了更高的要求,基于RDF图数据的应用和数据库也产生了对图数据质量进行验证的要求,它们希望RDF图数据具有一定的正确性和完整性。同时RDF图数据的质量保证有利于RDF图数据的管理。知识图谱验证问题成为图数据管理中被较少研究但十分重要的问题。对现有的图数据验证方案进行了详细的调研,总结了现有的研究方向和主要的验证方案。主要有两种知识图谱验证方法,分别是Sh Ex(Shape Expressions)和SHACL(Shapes Constraint Language),两者的作用都是验证知识图谱是否满足形状中定义的约束,同时总结了二者之间存在的区别。基于其中的SHACL对知识图谱增量式验证问题进行深入研究。基于SHACL的语义特点,提出了一种基于逆拓扑排序的非递归模式的RDF图数据的验证方案。本文区分约束类型,并且基于逆拓扑排序算法调整模式中形状的验证顺序,且为了便于访问已有的验证结果,提出一种辅助结构来存储模式中形状与图中节点的验证结果,有效的提高了RDF图数据的验证效率。在基准数据集和真实数据集上,提出的验证方案比传统验证方案减少约26%的验证时间。对一个已经满足某种模式的RDF图来说,如果图被更新,那么更新后的RDF图还应该满足这种模式,因此更新后的RDF图需要被验证。完整的重新验证更新后的RDF图是一种可以保证结果正确但低效的方式。本文提出一种基于非递归模式的RDF图更新增量验证算法,该算法可以正确且高效地处理更新验证地问题。此外本文还针对递归模式提出了基于非否递归模式的图数据更新增量验证方法。在基准数据集和真实数据集上,本文提出的增量算法与完整验证的方法比较,在验证时间上具有量级的差距。
其他文献
社会化推荐是一种将社交关系融入推荐系统的方法。在社会化推荐中,包括用户-项目交互图和社交网络图,用户是连接这两个图的桥梁,其表示学习对提升社会化推荐的性能至关重要。但是,现有的方法主要利用用户或项目的静态属性及社交网络中的显式朋友关系进行表征学习,用户与项目交互的时序信息及其隐式朋友关系未得到充分利用。因此,在社会化推荐中,如何有效利用时序信息和社交信息成为重要的研究课题之一。本文着重关注用户和项
学位
报纸
线索语是一种针对聋人或听力受损者的交流系统,说话人通过手的形状(编码辅音)和位置(编码元音)辅助唇读,以在音素级别对唇部视位进行互补表示。嘴唇、手形和手的位置特征的提取是线索语自动识别的关键步骤,其中手形特征的提取是该领域的难点之一。在线索语识别中,线索语的手唇运动异步问题往往导致基于音频分割的手形标注出现大量噪声。因此,论文首先提出一种基于自监督对比学习的方法学习手形的特征表示,以降低模型对数据
学位
随着经济社会的发展,人们对石油及其产品的需要持续上升,油轮交通、近海钻探、石油运输导致的海上溢油事件愈发频繁,而油类污染物的泄露会对海洋环境造成重大污染,对人类健康造成严重危害,因此,预测油类污染物的传播过程,减小污染物的影响程度变得迫在眉睫,而这依赖于对流扩散反应问题的准确求解。本文首先对溢油问题的数学模型进行了整理,通过Navier-Stokes方程组中的连续性方程和动量方程推导出浅水波方程和
学位
线索语是一种面向听障人士的视觉交流系统,用手部运动补充唇读信息以获得完整的音素表达。其相较于唇语和手语,在保证更完整的视觉信息表达,消除具有相似唇形的音素歧义同时,更加简单明确,适用于人机交互领域。但由于线索语数据不足导致其相关研究的识别效果受限。论文提出基于跨模态知识蒸馏的线索语自动识别的方法以克服数据不足的问题。该方法以教师-学生结构为载体,将从教师模型中提取的语音模态信息转移到学生模型的线索
学位
网络时代的到来,使得信息过载问题日益凸显。会话推荐系统是解决信息过载问题的重要工具。深度学习方法最近被用来建模会话数据,挖掘会话中的序列信息。虽然现有工作取得了良好的效果,但这些工作大多只将用户交互过的项目作为输入信息进行分析,忽略了用户活动发生的时间所反映出的用户兴趣。本文使用时间感知算法来解决会话推荐问题。时间向量生成器首先对用户活动的时间戳进行处理,得到用户在每个项目上的驻留时间和每次活动与
学位
水力发电因其具有清洁、无污染、廉价、可再生等特点,在国家的社会经济发展中有着极其重要的作用。对入库径流变化的精准预测往往是制定发电计划、进行电网调控调度的基础。由于水电站的入库径流受到上下游出入库径流及气象条件等多重因素的影响,当前基于随机过程的单步及多步自回归预测模型在预测精度方面都难以达到预期目标。本文将入库径流预测看作是一个监督回归问题,充分利用上下游出入库径流序列及气象条件信息,构建了单步
学位
深度神经网络(Deep neural network,简称DNN)因其性能出众,已被广泛应用于各大领域,因此保证DNN的质量是至关重要的。但是,为了得到DNN模型的准确率,需要人工标注大量的测试输入,成本巨大,甚至某些测试输入需要多人标注或者具有专业领域知识的人进行标注。这使得DNN测试存在严重的效率问题。为了缓解这个问题,本文提出了PACE(Practical ACcuracy Estimati
学位
500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,FAST)是目前世界上最大的单口径射电望远镜,空前的观测能力对数据处理性能提出了新挑战。河外中性氢(HI)谱线观测是FAST重要科学任务之一,Gridding是其观测数据处理流程中计算最密集的步骤,目的是将间隔不均匀的原始数据重新采样,输出到均匀划分的网格中,从而
学位
目的:分析分析下肢深静脉血栓形成患者应用机械碎栓联合导管接触性溶栓治疗后效果。方法:选取我院2018-06~2020-11收治的84例下肢深静脉血栓形成患者根据抽签法分为两组。对照组42例给予导管接触性溶栓,观察组42例联合机械碎栓,对比两组疗效、血栓弹力图及细胞黏附分子。结果:观察组临床效果、血清Pecam-1、血清Vcam-1、D-D、Fib、FDP较对照组低(P<0.05)。结论:机械碎栓联
期刊