基于GPU的若干图问题加速算法的研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:zjqhdh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图论是离散数学的一个分支,凡有二元关系的系统,图论均可提供一种数学模型,因而它在许多科学领域中具有越来越重要的地位。图论的很多问题在实现上都异常复杂,大多图问题都是指数级时间复杂度甚至是NP完全问题,并且随着问题的规模急剧增大,传统的串行算法往往不能满足实际问题的需要。传统的分布式计算(如集群)虽然能够在一定程度上的提高性能,但是这种模型组织较为松散,对算法自身的提高有限,并且会增加功耗及通信开销。图形处理器(GPU)具有很强的并行处理能力以及低廉的成本,并且能够处理的问题规模越来越大,因此利用GPU解决图问题已经成为当前的研究热点。本文选择了两个具有代表性的图问题进行研究:图同构、最小steiner树。对于图同构问题,目前最有效的一类算法—标准标签法要么适合处理随机性或对称性强的图,要么适合处理两者均不强的图,并且其最核心的操作独立-精炼及证书比较通常占据总时间的70%以上,如何削弱对图的结构的局限性并提高这些操作的效率是具有挑战性的。本文提出了一种高效的图同构算法:PEACE,能够有效地削弱结构对算法的影响,尤其适合处理对称度很高的图。本文同时第一次提出了图同构算法在GPU下的并行实现方法。本文将核心的操作并行化,设计了一些新的方法并利用了一些现有的技术实现CUDA下的加速计算,这些技术能够适用于所有基于独立-精炼的图同构算法。本文对多种结构的图进行了实验,将目前最有效的标准标签法与PEACE进行了综合的比较。实验表明,在处理对称性强或自同构很多的图时,PEACE算法效率明显优于其他算法,最好情况下能有50%的性能提升。本文还将提出的并行技术应用在这些算法上,并在CPU和多种GPU设备下的性能进行了比较,结果表明我们的并行技术在所有算法下均能获得15-55的加速比。对于最小steiner树问题,本文对目前最为有效的一类近似算法—GRASP算法在GPU下进行了并行化,在CUDA下实现加速计算。在基于生成树的构建阶段,本文提出一种计算最短路径矩阵的并行策略从而得到辅助图的边集,提出一种并行桶排序策略以得到辅助图的权值集合,利用并行Kruskal算法计算辅助图的最小生成树。在基于顶点的本地搜索阶段,本文采用并行的随机Kruskal算法更新局部解。本文还提出了利用多GPU求解此问题的计算模型,实现GPU间的粗粒度并行,GPU内部的细粒度并行。
其他文献
每年3月于德国汉诺威举行的CeBIT展览会是全球数码行业领先的贸易展会。它融合了展览展示与高峰论坛等活动,在业界享有颇高声誉。展会主题定为d!conomy随着日益发展的信息技
期刊
作为唯物辩证法的三大规律之一,否定之否定规律借助其循环、曲折和螺旋式的发展路径为思想政治教育话语体系的构建带来诸多启示.结合大学生诚信教育的时代境遇,高校思想政治
随着计算机仿真的发展,三维仿真技术已经广泛地应用到工业领域中。本文就是按照国家粉体中心的要求,为含能材料的生产流水线中的连续混合过程建立三维仿真系统,从而能够真实
电容层析成像技术(Electrical Capacitance Tomography,简称ECT)根据管道或封闭容器内多相流体中各相介质介电常数不同的原理,通过电容传感器、电容测量电路和数据采集系统测量出各极板间的电容值,并结合相应的图像重建算法将管道或容器内介质分布图显示出来,通过提取图像的特征参数参与过程控制。ECT技术具有适用范围广、非侵入、快速、安全性能好、结构简单等优点,近年来已应用于电
视频目标跟踪在视频监控、人机交互、智能交通等领域有着广泛的应用,它作为计算机视觉领域的核心问题之一,主要研究如何让计算机来实现人类的一些功能,比如模拟人的大脑来进
本文以广西财经学院的国际贸易专业为例,首先探讨了面向东盟的创新创业型国际贸易人才的内涵及面向东盟的创新创业型国际贸易人才培养的意义;其次分析了我校在面向东盟的创新
地处西部欠发达地区、目前尚未完全摆脱贫困、有的村民连吃水难、行路难问题还没有解决的陕西省咸阳市,一些乡村热衷于建广场、立雕塑、修花坛、移大树,花费巨额资金“打造”
P2P网络中的节点既充当客户端角色,享有其他节点提供的服务,又扮演服务器角色,为其他节点提供服务。非结构化P2P网络在网络拓扑构建上降低了节点进入和退出网络的维护开销,适
期刊