局部性感知的并行计算模型与并行编程模型研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ilovemn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
并行计算模型与并行编程模型一直是并行计算领域研究热点。并行计算模型为上层并行算法设计提供硬件抽象模型,并行编程模型为上层用户提供编写并行程序的基本构件与抽象模型。并行计算机体系结构在多个领域的发展出现了不同类型的层次性,例如存储层次不断增加的多核处理器及GPU加速部件,同时,在并行编程模型发展中,也出现了提供显式局部性控制构件的编程语言。对于事物建立抽象模型是对其深入理解并提供简化的设计平台的重要研究方法。为此,本文从局部性角度提出了若干模型对不同硬件平台和软件算法进行抽象,包括多核处理器,GPU加速部件,网络通信,非规则计算,并研究并行编程模型局部性特征。   针对多核处理器越来越复杂的存储层次,以及面向众多具有加载计算模式的并行编程模型、数据结构设计以及算法优化技术,本文提出了一个基于算法局部性函数的性能分析模型。利用该模型可以根据算法局部性特征,分析在具有不同深度存储层次架构上的性能。此外,本文还从数据访问角度扩展了Amdahl定律,得到了不同体系模型上的加速比,弥补了以往只关注计算能力加速比的不足。   针对近几年飞速发展的GPU计算技术及其复杂的存储层次,本文提出了延迟隐藏因子概念,并基于此设计了新的并行计算模型,描述了GPU计算中通过大量细粒度线程的执行与切换来隐藏内存访问开销这一与传统CPU计算最显著区别。   针对超级计算机互连系统出现的网络通信层次性,本文提出了LogGPH模型,将原始具有单层通信参数的计算模型层次化为具有一定自适应能力的多层计算模型。基于该模型,本文设计了新的MPI_Allgather算法的进程映射方案,充分地平衡地利用了各通信层次进行数据传输。   针对非规则计算的局部性,本文为图的广度优先遍历算法提出一个新的模型,该模型基于一个新的称为结点距离的概念,通过该模型将容易测量的结点距离映射为常用的程序局部性描述方法,即重用距离。从层次化的角度看,本文在重用距离签名之上建立了结点距离签名的概念,层次化了图算法的局部性描述,然后通过融合图拓扑信息的模型,将结点距离转化为重用距离。   针对众多并行编程模型设计中的局部性构件,本文进一步将局部性分为横向局部性和纵向局部性两种类型,对各种并行编程模型从两种局部性角度进行分析,明确了下一代并行编程模型和语言所应具有的特点,指出了未来发展以及研究方向。  
其他文献
近些年来随着信息技术的飞速发展,网络技术深入到生活的方方面面,特别是在网络用户密集的大中城市,为了获取到便利的网络连接,各个城市都在努力建设高效、便捷的信息网络,无
作为面向内存的分布式并行计算框架,Spark非常适合于迭代式计算,但是飞速增长的数据量和日益苛刻的实时性要求使得Spark平台的性能优化已迫在眉睫。为了解决Spark平台CPU计算能
EAST数据系统是EAST聚变实验的重要组成部分之一,EAST数据系统主要包含四个部分:数据采集子系统、数据储存子系统、数据发布和分析子系统、数据可视化子系统。   现有EAST
知识工程使人工智能的研究从理论转向应用。知识工程以知识为基础,知识获取、知识表示和知识利用都是知识工程研究的基础课题。知识获取和知识表示的研究对人工智能理论和应
自上世纪70年代美国微生物学家伍斯(Carl Woese)率先使用核糖核酸(RNA)序列研究原核生物进化关系并发现古细菌开始,基于16S rRNA基因序列的分析便成为研究原核生物多样性以及
近年来,互联网上应用种类急剧增多,数据量急剧增大。在这种条件下,用于大规漠数据处理的分布式计算获得了飞速发展。MapReduce编程模型的提出推动了分布式编程模型的发展。很
进入21世纪以来,电子政务网络平台随着通信技术和网络技术的进步得到了高速发展。在当今网络技术飞速发展的信息时代,电子政务网络平台的建设加快了集约效能型电子政务发展,提高
对于如何提升系统计算性能和改善能效比,传统的解决方案主要是依靠处理器优化,这无疑会进一步增加处理器负载。这些年,一种结合GPU、FPGA和DSP的异构计算方案正逐渐流行起来,由于
在复杂产品制造领域,协同设计逐渐发展成为产品设计的一种重要模式。产品结构复杂化、多学科协同化和人员协作密集化都导致目前产品设计过程的复杂性越来越大。因此,在产品设计
随着互联网时代的来临,数据在以前所未有的方式爆炸性增长,海量数据存储和处理的场景也越来越多。在这种背景下,以Hadoop为代表的分布式海量数据处理框架应运而生,Hadoop的分布式