大规模图上的最小生成树并行算法研究

来源 :东北大学 | 被引量 : 3次 | 上传用户:ouerfadaide
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最小生成树(MST)作为图论中最经典算法之一,引发了人们经久不衰的关注。由于MST的性质,在规划、网络和医学等各个领域得到了广泛的应用。同时,基于MST结构的聚类、分类和最短路径查询等复杂图算法,在效率和结果质量方面均有显著提高。然而,随着互联网的迅猛发展,图规模也变得越来越大,包含千万甚至上亿个顶点的大规模图越发常见。因此,如何在大规模图上实现查询处理和数据挖掘算法已成为了亟待解决的问题之一。除此之外,由于大规模图的动态性特征,即图的拓扑结构可能会发生改变,如何动态地维护算法结果也势必成为最受关注的问题之一。本文提出并行MST算法和MST动态维护算法,为上述问题提供了坚实的基础。首先,本文利用以边为中心的设计思想,提出了边驱动的并行MST算法。同时,本文设计了分布式索引、分区加速和基于直方图排序等优化技术,提高了算法的执行效率。随后,基于不同的通信模型实现了并行MST算法并分析了算法的时间复杂度。实验验证了算法的有效性,以及分布式索引和基于直方图排序技术的高效性。其次,本文从顶点为中心的角度出发,提出了顶点驱动的并行MST算法PB,并论证了PB算法的正确性。另外,本文给出了PB算法的终止条件和索引维护策略。随后,分别列出了基于MapReduce和BSP框架的PB算法的整体执行过程,其中包括启动作业和循环作业的详细处理流程。同时,本文分别针对上述框架剖析了PB算法的时间复杂度。实验证明了PB算法的有效性、高效性和可扩展性。最后,针对图的动态性特征,本文定义了动态图的五种操作并提出了MST结果的分布式动态维护算法MTBM。同时,本文给出了二次划分和分布式MST构建等预处理算法。在预处理之后,分别针对插入、删除和修改等操作,设计了相应的维护策略,并分析了MTBM算法执行代价。实验证明了MTBM算法的可靠性和高效性。总之,本文从大规模图角度出发,针对MST问题展开一系列研究,分别提出了边驱动和顶点驱动的并行MST算法以及MST结果的分布式动态维护算法。本文的研究工作,即大规模图的MST结构,为其他复杂的查询处理和数据挖掘算法提供了应用基础。
其他文献
传统工艺作为我国优秀传统文化的重要内容,与人民群众生产生活密切相关,具有带动贫困地区群众就近就业、居家就业的独特优势,是助力精准扶贫的重要抓手。桂西地区是我国“十三五”扶贫攻坚主战场和传统工艺资源聚集区,该区域包括百色、河池、崇左所辖的30个县,其中国家级贫困县占全区总数的63.0%,该区域精准扶贫成效很大程度上关系到广西乃至国家脱贫攻坚的进展。近年来,我国高度重视传统工艺振兴助力精准扶贫工作的实
固有无序蛋白自身结构的松散性使得它可以与多种生物大分子结合,在细胞功能调节与信号传导中占据重要的角色,与许多人类重大疾病存在着密切关系,成为当前研究热点。然而由于
在信息化时代的今天,电子邮件成为了我们日常生活中最重要的交流手段之一,与其相伴而来的垃圾邮件也在日益增长,影响着人们的生活。传统的垃圾邮件过滤技术,如“黑白名单”、
脑积水是因颅内疾病引起的脑脊液分泌过多、循环和吸收障碍而致颅内脑脊液存量增加,脑室扩大的一种顽症,属中医“解颅”的范畴。经穴体外反搏疗法是我院综合运用传统中医经络穴
2000年2月-2003年12月,我院骨科对15例髋关节外伤患者行全髋关节置换术,通过精心护理和有效的康复指导,收到了较好效果,现将护理体会报告如下:
目的探讨丙型肝炎病毒(HCV)RNA定量标准品的制备方法。方法用HCV-RNA阳性扩增目的片段,产物与pGEM-T载体连接并转化感受态大肠杆菌DH5α,经筛选和测序鉴定,阳性质粒体外转录合
结直肠癌是常见的消化道恶性肿瘤之一,其发病率和死亡率在世界范围内呈现上升趋势。对于结直肠癌的治疗是以手术为主,辅以化疗、放疗、靶向治疗、介入治疗、免疫治疗等的综合