基于节点影响力的子图匹配算法及其并行化

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:flurryzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
子图匹配是图论里的一个重要研究内容,目前,它已应用于社交网络分析、蛋白质相互作用网络的功能推测等诸多领域。候选匹配集初始化时,由于许多孤立的无效节点被包含在该集合中,在后续步骤中需要对这些节点进行过滤和判断,算法效率较低,因此随着网络规模的增大,算法的可扩展性较弱。除此之外,当查询图的规模增大时,常见的子图匹配算法不能在有效时间内得到合理的匹配结果。针对上述问题,本文对子图匹配算法进行了改进,具体工作如下:(1)针对子图匹配算法在大规模的目标图上的扩展性较弱的问题,本文提出了基于节点影响力的子图匹配算法(Inf SMatch,Influence-based Subgraph Match)。考虑到候选匹配集合中存在孤立节点的问题,本文提出通过考虑节点的全局和局部结构特征信息来计算查询图上所有节点的影响力,选择影响力最大的作为中心节点,此举能够大大减少初始候选集合中孤立的无效节点的数量。为了使得每个候选匹配区域尽可能的小,本文利用宽度优先搜索对子区域进行扩展,针对该扩展过程,我们还提出了更详尽的过滤策略对候选匹配集合进行进一步剪枝。除此之外,在验证阶段本文通过考虑节点的重要性以及节点间的连接性来确定节点的验证顺序。实验表明本文提出的方法比其他常见的算法效率更高。(2)针对查询图较大时子图匹配效率较低的问题,本文在InfSMatch算法的基础上提出了基于查询图分解的子图匹配改进算法QDSMatch(Query Decomposition Based Subgraph Match),并基于Spark并行计算框架对该算法进行了实现。为了减少连接开销,本文利用社区划分算法将查询图划分成多个查询子图,分别对每个查询子图进行操作,对查询结果进行连接得到同构子图。在对每个查询子图进行匹配时,本文通过计算每个查询子图的平均度数以及查询子图之间的连接性,确定了查询子图的匹配顺序。除此之外,本文还提出了一个新的过滤策略,有助于减少候选集合的数量。同时,本文利用Spark框架对QDSMatch算法进行了并行化处理。实验结果证明,最优CPU核数与查询图大小相关;与其他并行化子图匹配算法相比,QDSMatch算法更加高效。
其他文献
语文以工具性和人文性的统一为基本特点,是重要的交际工具。口语交际能力注重信息的双向互动,是语文素养的重要组成部分。为加强学生口语交际能力,提升小学语文的教学质量,本
细针穿刺技术越来越多地应用于医学临床,为临床的诊治工作尤其在肿瘤诊疗方面提供了极大的便利,现已在脑部、甲状腺、乳腺、肺脏、纵隔和腹部等许多疾病开展了穿刺活检技术,我科
一、践行全新办学理念学校以“让爱润泽生命”为教育理念,将“崇尚美德、好学求知、优化个性”的校训作为学生的成长愿景,坚持“弘扬传统文化、培养创新精神、实施爱的生命教育
背景:胰腺癌为常见的消化道恶性肿瘤之一,由于其特殊的解剖位置及其生物学特性,胰腺病变大部分早期不易发现,且临床症状多不典型,确诊时已为中晚期。临床研究发现胰腺癌发病
患者,女.78岁。右上腹轻度胀痛,进食逐渐减少.自触及右上腹一包块来就诊。体检,老年女性,一般情况好,于右肋缘下触及一椭圆形肿物,活动度差,肝功能正常,HBSAg(-),AFP10ng/ml,血糖5.5mmol/L
<正>4月上旬,按照省委宣传部要求,省国资委党委抽调精干力量联合组成调研组,对我省部分国有大型企业进行了专题调研,掌握了我省国有企业理论武装工作的基本情况。一、理论武
随着城市道路周边的高强度开发,城市道路两侧的接入口不断增加。商场、停车场、居民区、办公区的车辆都需要从接入口处接入城市道路。更多的接入口会增加道路的通达性,使需要达到道路两侧的车辆更加方便。但接入口的增加会极大地影响城市道路的运行效率,即机动性。城市道路交通网络是一个动态的复杂系统,交通状态微小的变化都会在城市道路交通网络中传递而造成较大的影响。在城市道路的接入口附近,受接入口交织段上接入车辆与主
3月20日在慕尼黑举行的奥迪公司2000财政年度的新闻发布会上,公司董事长帕夫根博士用这样一句话形容该公司在2000年取得的业绩:“这是非常多姿多彩的一年,也是公司历史上最成
数学本身就是一门比较难的学科,很多学生数学成绩比较差,所以从小学开始就要注重让学生养成自主学习的能力,这对学生养成好的习惯有重要作用,对学生以后各方面的学习更是有重