集群系统中MPI并行程序性能分析方法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:hll10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集群系统的发展使得并行计算能够广泛地应用于各行各业。在异构集群系统和虚拟机集群系统上运行并行程序已成为并行计算的一种发展趋势。   在实际应用中,由于受到程序员水平的限制,开发出的并行程序往往存在很多性能瓶颈,对并行程序进行性能分析,帮助用户快速定位性能瓶颈,找到导致性能瓶颈的原因非常有必要。本文以SPMD(Single Program Multiple Data,单程序多数据)模式的MPI(Message Passing Interface)并行程序为研究对象,旨在对运行在异构集群系统和虚拟机环境下的MPI并行程序进行性能分析,为用户优化并行程序,进而提高并行程序的性能提供辅助信息。   本文首先介绍了并行程序性能分析的相关理论和技术,总结了目前并行程序性能分析领域的研究成果。其次,在异构系统下,本文基于Instrumentation技术采集MPI并行程序的性能数据,通过分析采集的性能数据,提出了一种异构系统下MPI并行程序性能分析方法,并使用此方法对三个MPI并行程序进行了性能分析,实验结果验证了该方法能够有效地定位并行程序的性能瓶颈,揭示导致性能瓶颈的原因,为有针对性地优化并行程序奠定了基础。第三,在Xen虚拟机环境下,本文提出了一种使用Instrumentation和Sampling相结合的并行程序性能数据采集方法,并对Xen虚拟机中运行的MPI并行程序进行了性能数据采集和性能分析。第四,本文设计和实现了并行程序性能分析工具PerfAnalyzer,支持对异构集群系统和Xen虚拟机环境下的并行程序进行性能分析,该工具的主要功能有:性能数据采集、管理、分析、可视化和实验流程管理等。最后,对本文的主要研究成果进行了总结,并展望了未来的研究工作。   总之,本文的研究成果对集群系统中MPI并行程序的性能分析具有重要的参考价值,能够帮助用户优化MPI并行程序,提高代码质量,进而提高MPI并行程序的性能。
其他文献
进程的在线迁移是分布式集群系统中的关键技术,一直以来是国内外活跃的研究课题。然而之前研究人员主要关注无用户交互的进程,如服务器守护进程,而本文的研究重点是GUI应用的在
心电图(ECG)记录着一个心脏的电活动,是与心脏搏动相关的电位变化图。心电图在诊断各种心血管疾病诸如冠状动脉疾病、心肌缺血、损伤和梗死等疾病时具有特别重要的意义。本文
随着航空航天技术不断发展,空间通讯协议规范种类日益增多,不同国家不同项目所选用的通信协议通常有或大或小的差异。在合作项目中,对通信协议理解上的差异或者使用的协议规范版
中国煤炭企业的安全生产问题面临着严峻的挑战,物联网的广泛应用,提供了对煤矿安全进行实时监控的可行方案。本文通过对物联网应用以及煤矿信息监控需求的调研,提出了基于物
互联网的出现使得信息不断激增,搜索引擎给人们提供了一种从海量信息中定位信息的有效工具。然而信息增长的速度超乎人们的想象,在信息爆炸面前,传统的通用搜索引擎查询方式
无线传感器网络因其本身能量有限的特性,自产生之初就面临网络长效的问题,本文研究了WSN中的网络覆盖、流量调节和区分服务三方面的内容,旨在令网络能够在一定程度上克服上述
随着多核体系结构的发展,程序并行化技术面临着巨大的挑战。一方面,程序中数据的间接引用、指针别名、复杂的控制流等问题使得静态的依赖分析变得十分困难;另一方面,一些系统
随着科技的发展,社会的进步,移动通信网络的能力和规模持续升级,新技术不断推陈出新。通讯、金融、教育、交通、政府、企业等各行业的迅猛发展都越来越密切地依赖于移动通信
随着空间技术的发展,在未来大型复杂航天器上将会有大量的空间应用,应用任务领域广泛、载荷种类繁多、在轨时间长(长达10年),数据类型多、数据量大、数据速率高(高达20-80Gbps)
形式化模型的行为语义确定了系统行为的执行方式,是系统性质验证的基础。本文基于Petri网模型,提出行为的一种描述方式——标准变迁集语义。这种语义提供了Petri网发生行为的一