KD60平台MPI通信库优化设计

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:heeroyuyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
体系结构的发展使得大规模集群已经发展到多核的时代,多核架构对并行计算提出了新的要求。通信在并行计算中扮演着重要的作用,提升多核架构下通信的效率对提升并行计算的效率有着重要的作用。KD60平台是采用首款国产多核芯片---龙芯3号搭建的国产万亿次多核集群。在并行计算中,常用的并行编程模型有消息传递模型和共享内存模型,MPI是最常用的消息传递编程接口,MPICH2通信库是符合MPI-2标准的一种重要实现。本文的主要工作就是为国产高性能集群平台KD60移植与优化MPICH2通信库,在结合kd60系统体系结构以及网络拓扑特点的基础上,分别提出数种优化方法分别对点到点通信以及群集通信的性能进行了优化。本文的主要工作可概括如下:1.分析了多核体系架构的特点以及其存储层次模型,并指出多核架构下的通信存在的特点,并简要介绍通信所需的分析模型。2.分析MPI标准的实现MPICH2库的结构及其各模块实现,同时指出在多核架构中,其实现中存在的不足之处。3.对于MPI中的点到点通信,分别优化节点间网络通信性能和节点内共享内存通信性能:对于节点间网络通信性能,采取了TCP网络参数调整以及网卡校验和的卸载等技术进行优化;对于节点内共享内存的点到点通信优化,采用了编译领域常用的数据切片技术优化通信中数据的局部性访问,同时结合KD60平台的CPU---龙芯3号体系特点,利用龙芯3号128位访存指令优化内存拷贝的效率,另外还针对节点内点到点通信的实现,采用单拷贝技术替代原有的双拷贝,降低内存拷贝次数,提升节点内点到点通信的性能。4.对于MPI中的群集通信,根据第1条中提到的多核体系架构下的通信特征,优化原群集通信函数的通信路径,并根据群集函数通信模式的不同,对于一到多模式和多到多模式的群集通信函数,以广播和全局交换为例,详述其优化算法。实验结果表明,本文中采用的优化方法都从不同程度上提升了MPICH2通信库的性能。
其他文献
二维条码是对一维条码的扩展,目前已被广泛应用于出版业、制造业、医疗卫生、证件管理等领域。至今为止,国内外研制的二维条码已达数十种之多,但这些条码的设计都面向于一般
随着互联网的迅猛发展,网络上的文本信息呈指数级的增长。网络信息的高流动性使得这些文本中存在大量重复的信息。这些重复文本会给信息检索工具带来巨大的挑战,所以如何快速
随着计算机软件技术的快速发展,软件产品已经应用到社会的各个领域,现今的软件已经逐步成为构件组装的集合体,这样,每个构件的质量的好坏将直接影响到软件的整体质量。所以,
流水作业调度问题是一类具有广泛应用的组合优化问题。总完工时间、总误工时间、最大完工时间和总加权误工时间是几个重要的性能指标。论文对最小化总完工时间的流水作业调度
近年来,软件网络化、服务化的趋势使得软件的交付模式、应用模式、产品形态和商业模式都产生了巨大变化,软件已经成为一种服务(Software as a service,SaaS),即人们以“使用
随着计算机互联网的蓬勃发展,网络攻击频繁发生,如蠕虫病毒、分布式拒绝服务攻击(DDoS)、端口扫描等。这些攻击事件在短时间内产生大量的网络链接,导致网络堵塞甚至瘫痪。如
序列模型就是结构化模型中的一个经典模型,在自然语言处理、计算机视觉、生物信息学等领域得到了广泛的应用。对其模型及算法的研究和改进,具有重大的意义和实用价值。在过去
基于视觉的智能导航系统是机器视觉领域中的研究热点之一。道路识别算法作为智能导航系统的重要组成部分,采用图像处理、机器学习与模式识别等技术检测道路路面,为智能导航系
学位
随着经济全球化和市场国际化,使得企业间的竞争日趋激烈,企业的生产过程也越来越复杂,企业要保持核心竞争力,就必须要使其各个业务流程紧密联系,协同配合。计算机支持的协同