论文部分内容阅读
图结构模型常被用于互联网,生物,计算机视觉和化学等领域中描述复杂的数据对象及对象之间的关联关系。图搜索在图计算研究领域扮演着十分重要的角色,图搜索可根据其应用场景的不同分为两类:子图查询与子图匹配,其中子图查询是在图数据库中找出所有与查询图匹配的超图集合并返回;子图匹配则是从图数据库中找到所有与查询图同构的子图集并返回。无论是图搜索中的图查询亦或是图匹配,均需要借助于子图同构算法来对查询图与返回结果中的图进行同构判定。众所周知子图同构问题是NP完全问题,在业界中图同构问题是通过搜索剪枝的快速启发算法来实现。基于搜索的子图同构算法在时间开销过大,所以若对数据库中的所有图逐一扫描并判断同构关系是不现实的。针对这一问题科研人员提出并运用的图索引技术,通过为图构建索引来将一部分不满足查询匹配条件的图过滤掉。通过这种方式将需要执行同构检测算法的图集规模尽可能的减少,以此来从全局提升图匹配查询算法的执行效率。科研人员也基于图索引算法提出了现今最为常用的,基于过滤-验证的图匹配查询的算法框架。传统基于挖掘与非挖掘图索引算法受限于图规模大小,当图规模变的十分庞大时便失去研究价值。在本文中,我们首先提出了一种基于树型结构的邻域索引,并通过该索引用来提升图搜索算法的执行效率。同时将邻域索引作为通用的模型,对基于邻域索引的图匹配框架进行抽象并总结出其算法框架的代价估算函数。不仅如此,我们还参照于使用十分广泛的VF2子图同构检测算法框架设计出了一种以树型索引项为单位的图匹配算法,并通过该算法来获取被查询图中所有与查询图满足子图同构的映射关系集合。在文章的最后,通过实验对比数据来验证我们所提出的基于邻域模式的DFSTree索引和基于该索引的图重构匹配算法要优于当今主流的基于邻域模式的SPath索引算法。在实验阶段我们分别在索引构建时间与空间,索引过滤候选集大小,以及基于索引的图匹配查询算法在返回匹配结果的平均响应时间与算法返回的匹配结果来进行对比分析。通过实验结果数据来验证得到,基于树型结构的DFSTree邻域索引虽然在构建时间与空间上稍逊色于当今主流基于最短路径的邻域索引SPath算法,但是在查询响应时间与过滤后对候选集中呈负相关的候选元素的过滤强度而言都优于SPath算法。