论文部分内容阅读
图数据库(Graph Database,GD)是一种用来高效处理复杂关系网络的新型数据库系统,它是基于数学图论的思想与概念,并广泛应用于社交网络、实时推荐、征信系统、人工智能等领域,其中图数据的处理是国内外数据应用研究的重要方向。然而,GD在实际应用过程中,因为丰富的应用场景,海量的数据,加上复杂的数据结构等因素影响,导致数据查询效率低,服务质量得不到保障。因此,如何有效地提高图数据的查询处理能力是图数据库研究的关键问题。图数据查询处理优化技术的主要研究核心是如何快速有效地对图数据进行剪枝,利用图数据结构的预处理和索引的构造来降低查询数据的规模,最终快速获取准确的结果。本文就两个方面进行具体的阐述:首先,本文在已有的二分图枚举算法的基础上,提出了基于最大完全二分图的分层算法。该算法有以下创新点:一是提出了一种基于最大完全二分图的分治策略,它利用子问题的解来不断更新最大完全二分图的约束条件,实现降低候选集规模的目的;二是提出了两种高效的剪枝策略以及初始化策略,用于压缩原图,达到减少查询次数的要求。其次,本文提出基于特征节点的图索引技术,可利用两个参数中心点和路径长度,对图数据进行快速剪枝。该索引技术有以下优势:一是采用图节点的支持度和访问量为索引特征,避免了开销昂贵的频繁子图挖掘方法,降低了索引构建的时间;二是依据特征节点(中心点,center),使用密度聚类对图数据进行分割,最后基于聚类结果来建立树状索引,减少了查找数据的规模。实验结果表明:本文给出的图数据查询技术提高了数据查询效率,缩小了搜索空间的范围,改善了数据查询的服务质量,降低了索引空间的开销。