面向多种体系结构的BFS算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:yutianweixiuwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广度优先搜索(BFS)是许多图形应用程序的底层内核算法,如社交网络,医疗信息学,传输系统等。因此,它已被吸收为Graph500的核心,用于评估超级计算机大数据处理的能力。本文依托广州超算中心“天河二号”提供的平台,针对分布式内存体系结构和共享内存体系结构对BFS算法进行了研究。首先,本文量化分析了分布式内存体系结构上BFS算法的性能瓶颈。并且提出了分布式内存体系结构上关于负载均衡的优化方法,在“自顶向下”阶段同步重点是否被访问过的信息,在“自底向下”阶段同步重点队列信息来达到平衡各个进程通信次数的目的。同时,本文通过对异步小消息通信库重新封装消息头的方式来减少通信消息的长度和通过本地标记的方式来减少无效通信次数的方式,减少了分布式内存体系结构上的通信量。其次,本文针对Knights Landing(KNL)芯片对共享内存体系结构的BFS算法进行了优化。对于KNL的异构存储器层次结构,本文利用KNL芯片提供的Flat模式,利用MCDRAM和DRAM的性能差异,通过将顶点数据、父节点数据分配在MCDRAM上,把边缘数据、临时变量和数组分配在DRAM上的方式来实现更快的读写数据和内存访问。同时,对于高速缓存更新策略,本文的主要工作是利用Clik来对算法的细粒度进行重新划分,来保证每个工作线程读取恰好适合一个CPU缓存行大小所对应的顶点的值,并且每个值的更新不会影响其他的缓存行。最后,我们在Tianhe-2超级计算机和KNL芯片上评估了本文的实验。实验结果表明,在分布式内存体系结构下,我们的方法有效缩短了通信时间,与自上而下的方法相比,获得了 3倍左右的加速比。在KNL平台,我们的方法有效的减少了最后一级缓存load和store指令数,在rmat图上获得了 10倍左右的加速比。
其他文献
近年来,随着集成电路工艺的飞速进步,无线电通信技术的发展进入了一个崭新的阶段。N通道滤波器由于具有容易集成、中心频率可程控调节、频率选择性高和线性度好等优点,因而广
公司治理是公司金融领域的核心问题之一,其中股东和管理者之间的委托代理问题更是公司治理研究的经典主题,学术界关于股东对公司价值影响的文献非常丰富。相关研究最早可追溯
大数据中的海量样本、大规模类别和高维特征为机器学习带来了丰富的信息。类别之间还往往呈现出复杂的结构关系、不可避免存在的噪声数据也降低了数据的质量和可用性。这些数
随着油田进入高含水开采后期,开采难度逐渐加大,应用新技术、新装备是油田发展的必然趋势。近几年,油田加大了水平井、定向井技术的攻关研究与应用。为了使室内试验研究走到
针对水泥工业生产中面临着高污染、高能耗的问题,如何有效改善环境,提高水泥生产效率已成为行业关注的焦点。高温水泥熟料的冷却以及伴随产生的热量回收便是亟需解决的问题,
增广类别学习(Learning with Augmented Class,LAC)是应对开放动态环境问题的重要方法,而大多数现实应用都面临着开放动态环境的问题,因此LAC方法的研究有着重要的现实意义。
在全球气候变暖和环境污染的压力下,人们对汽车发动机有害气体的排放越来越重视。燃油经喷油器喷入燃烧室后会出现雾化现象,雾化质量会影响有害气体的排放,而柴油液滴与金属
妇科分泌物常规检查是最常见的妇科检查项目,该项检查的主要目的是检查阴道是否有炎症,并进一步确定炎症的类型。同时,该检查也常用于宫颈癌的初筛。临床上现有的人工检查方
广义频分复用(Generalized frequency division multiplexing,GFDM)作为一种数据块结构的多载波调制方案,具有结构灵活,带外辐射低,频谱利用率高等特点,是超5代移动通信系统
根据研究表明,爆炸的破坏效应主要是由冲击波引起的,冲击波作为其主要杀伤因素,具有远距离破坏目标的作用。在复杂外界环境条件下,冲击波传播机理的确定对于这些武器的威力评