基于图的语义查询与推理研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zhangliu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为离散数学与计算机科学中重要的数据结构,越来越多的新兴技术领域开始用图模型来表示现实世界中的复杂的数据实体,以及实体与实体之间的关系,同时对一些具有不确定性的复杂网络建模时,还可以将其建模为不确定图。然而图数据丰富的语义特征和复杂的内部结构,极大的增加了各种图处理算法的复杂度,随着数据量的增加,提高图数据尤其是大的图数据处理算法的性能具有重要的现实意义。因此,本文进行了基于图的语义查询与推理算法的相关研究。基于社交网络等实图数据的语义和结构特征,本文提出了一个新的大图中的近似子图匹配查询算法ASMQ,算法在查询过程中不像子图同构那样,严格的要求拓扑结构和节点标签完全相同。算法首先介绍了子图匹配测量模型,从结构和节点标签信息两个方面来衡量查询图与匹配子图的匹配程度。然后根据邻节点域索引从目标图中过滤得到候选节点集合,最后采用启发式推理方法从候选节点集合中确定最佳匹配子图。实验证明,ASMQ算法在查询精度和查询效率方面都一定程度上都优于现有的近似查询算法NeMa。在非确定图中,本文基于其概率属性特征,设计了一个关系可靠性推理算法,推理出在非确定图中,与源节点集合的关系大于给定概率阈值及语义相似度阈值的所有节点,算法首先利用METIS对非确定图进行分层聚类,构建SRR-Tree索引,然后利用SRR-Tree索引根据推理条件和节点标签语义信息过滤得到候选节点集合,最后分别使用了基于下边界的确认和基于抽样的确认两种确认方法,从候选节点集合中确定最终的推理结果。实验证明,算法具有较好的可靠性推理性能。本文基于第三章的图查询算法,开发实现了一个可视化的子图匹配查询系统,以更直观的方式展示查询结果,从而可以从图数据中发现更多有用的信息。
其他文献
随着互联网的飞速发展,互联网上的数据正以爆炸式的速度增长,互联网上由用户构成的各种网络的规模也飞速增长,大规模网络的时代已经到来。在分析大规模网络的时候,希望能够有
通过代价模型可以为所要解决的问题提供一个参考模型,挖掘出问题中隐含的有价值的信息,并节省时间和费用;通过代价模型,可以基于过去和现在的信息估计即将进行操作的代价函数
“X是X”和“X归X”指的是主语和宾语同形的同语结构,文章将含有“X是X”结构的定义为“是”字式,将含有“X归X”结构的定义为“归”字式。根据语表形式的不同,“是”字式可分为三小类,A类“X是X,P”;B类“X是X,Y是Y,P”;C类多项式“X是X,Y是Y,……,P”。相应地,“归”字式也分为此三类。在语表形式、语义内涵以及语用功能方面,“是”字式和“归”字式均存在异同。语表形式上,两种格式的相同
伴随着计算机技术的发展,嵌入式系统在诸如航空航天、核应用、轨道交通和医疗等安全关键领域的应用更加广泛。如何保障系统的安全性,防止系统故障导致灾难性事故发生,成为当
分形理论是非线性科学研究中的重要课题,也是当今世界十分风靡的新学科与新理论。分形理论,可以很好的诠释在欧式空间中一些无法被描述的现象,也因此被广泛地应用于地球物理,
在复杂系统中,可靠性和性能一样重要。故障可能会彻底改变系统行为,从性能降级一直到系统不稳定。容错控制(Fault Tolerant Control,FTC)就是为了达到系统目标,或者当系统目
渭河盆地地处中国重要的大地构造分界位置上,北接鄂尔多斯台地,南邻秦岭褶皱带,东缘为山西隆起带,西端与鄂尔多斯西南边界弧形断裂束相接,对渭河盆地及邻区的地震重定位和层析成像有利于研究盆地构造并进一步解释地震、地质灾害的分布及发育规律。双差地震定位法通过引入地震走时的残差,可以获得精度较高的震源定位参数,且其可以不使用台站矫正就可减少由速度模型带来的误差。双差层析成像(Double-differenc
量子点是半径小于激子波尔半径的纳米晶,颗粒尺寸一般介于1~10 nm之间。量子点是近年来发展起来的一类新型功能材料,因其独特的量子限域效应和可调控的光电性质,在发光二极管
自身免疫性溶血性贫血(autoimmune hemolytic anemia,AIHA)/Evans综合征是一种由免疫系统对抗自身红细胞和/或血小板,导致红细胞和/或血小板寿命明显缩短、破坏增多的免疫性血
本文以航空燃气涡轮发动机中的涡轮叶片间为研究对象,在涡轮相邻叶片间组织燃烧。采用数值模拟的方法,对涡轮叶间的燃烧过程进行模拟研究。首先,提出布雷顿循环逼近卡诺循环