UPC语言对图搜索算法的支持与优化

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:xboaty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为离散对象之间关系的灵活抽象,被广泛应用于很多科学计算和一些新兴的应用领域包括基因组学、天体物理学、人工智能、数据挖掘等。图的宽度搜索算法是用于探索图中具有某种属性的顶点、路径及边的集合的重要方法,也是其他一些重要图算法的基础。云计算与社交网络的兴起使得图搜索算法得到了更广泛地应用。随着图问题规模以及单一计算节点的计算和存储能力的局限性,图的分布式实现得到越来越多的关注。但是图搜索算法所具有的一些固有特征,包括数据驱动的计算、非规则的并行性、较差的数据局部性和高的通信/计算比,给集群上的高效地实现带来巨大的挑战。本文主要关注方便图搜索算法的设计与实现的并行编程模型支持及其在新型高性能计算系统上的高效实现。   本文针对PGAS语言(以UPC为例)对图搜索算法的表达和优化上的不足,借鉴Kashev Pingali等人提出的以数据为中心的算法抽象-Operator Formulation of Algorithms,提出了适合集群系统的Shared Work List语言扩展,并在Berkeley UPC的编译器和运行时系统中实现。Shared Work List具有三个比较重要的特征,即灵活的执行模型、统一的通信优化机制以及对集群级投机执行的支持。其次,面对曙光6000龙芯分区所具有的诸多新体系结构特征,我们扩展了UPC语言的底层通信库GASNet以支持曙光6000龙芯分区具有的三层通信网络。最后,在三种不同的平台上,包括共享存储多核平台、64节点的集群系统和曙光6000龙芯分区,实验评测了使用Shared Work List实现的Graph500基准测试程序的性能。实验结果表明,在一定的数据规模及参数下,基于Shared Work List的Graph500在不同的平台上都表现出接近甚至好于MPI和Open MP版的性能及可扩展性,具有较强的性能可移植性。
其他文献
协同科研环境在线服务为科研人员提供云端的信息保存和分享服务,进行协作科研。科研信息和数据及相关知识产权的保护通常是科研人员非常关心的,云端数据隐私保护也是当前重要的
复杂网络普遍呈现出社团结构特征。直观上,这意味着复杂网络可能包含一些局部结构模块(即社团),使得每个模块内部联系紧密且与外部联系较为松散。每个节点仅归属于一个社团的社团
当前互联网面临的挑战之一就是路由系统的可扩展性。路由表的快速增长以及越来越频繁的BGP更新,对核心路由器的性能、复杂性、能耗和成本产生了越来越大的压力。近年来,大量网
在计算机科学、高能物理科学、生物学、超大规模集成电路设计、地球学、电子工程等领域,都存在着大量的优化组合问题,如旅行商问题、图着色问题、设备布局问题,其中的一些问题至
生物信息学是应用计算机技术开发算法和统计方法对数据进行分析,确定其所含生物学意义,以实现对生物信息的获取和管理的学科。中国科学院微生物研究所网络信息中心近年来一直致
随着社会经济的发展,人类活动的范围越来越大,面临突发事件和异常事件越来越多,视频监控的重要性与难度也越来越突出,传统的依靠人工来处理海量监控视频数据的方式已经无法满足目
本论文主要介绍了基于Linux的EAST分布式集群系统的设计与实现。随着EAST实验的不断深入,为了满足实验需求和用户对高性能计算的需要,几年来实验室不断购置服务器,新服务器日益
由于光刻对于光源的功率和线宽提出了很高的要求,传统的单腔结构准分子激光器很难在这两方面兼顾。MOPA结构的准分子激光器可以很好地解决激光功率和线宽的矛盾,这一结构的准分
中医知识库是集中医领域内相关医学医药理论知识、事实数据以及根据中医专家经验得到的启发式知识于一体的智能数据库。舌诊是观察舌头的色泽、形态的变化来辅助诊断及鉴别病
随着不断增长的信息化建设需求,提高软件开发的生产力并保证软件产品适应多变的客户需求成为信息化建设领域的两个核心问题。本文试图从软件过程改进和技术革新两个方向共同切