多核集群环境下基于MPI的程序性能优化的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:zhoujans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机硬件体系结构的不断发展,多核集群逐渐成为当今高性能计算机的主流架构。在2010年11月的全世界500强排名中,82.8%的超级计算系统使用集群体系结构,并且绝大多数的系统使用多核处理器。MPI(Message-PassingInterface)作为基于消息传递的并行编程模型事实上的标准,具有可移植性好、功能强大、效率高等多种优点,而且有多种不同免费、高效、实用的实现版本,非常适合应用于集群这种分布式存储结构的并行计算环境。但是,多核集群是混合式的存储体系结构,具有节点间分布式存储和节点内共享存储的特点。传统的基于MPI的程序与多核集群架构的匹配度较差,无法充分发挥硬件体系结构的特点,使得MPI程序在多核集群环境下无法达到最佳的计算性能。   本文主要研究在多核集群环境下使用MPI+OpenMP混合编程模型,即在原有的基于MPI的程序中加入OpenMP多线程编程技术,充分利用集群中单个节点多核处理器共享存储结构的特性,从而提升程序整体的性能。本文在对混合编程模型充分研究的基础上,结合两个应用实例——结构工程领域的有限元分析软件OpenSees和生命科学领域的PPI网络模块划分软件,重点研究了它们的分析过程、MPI并行机制和并行程序的性能瓶颈,并根据实际问题应用OpenMP不同的并行机制和并行化粒度实现了对原有的MPI程序的性能优化。将优化后的并行程序运行于多核集群系统之上,并与原有的基于MPI的程序作了性能方面的比较。实验结果表明,优化后的并行程序确实在性能上有比较明显的提升。   本文的完成为原有的基于MPI的程序向多核集群系统迁移或在多核集群环境下设计和实现新的、高效的并行程序提供了可参考的解决方案。  
其他文献
传统的场景绘制技术是基于几何的绘制(Geometry Based Rendering,GBR)。为了准确、完整的绘制场景,首先必须进行复杂的几何模型、光照、材质属性的建模,然后对物体进行着色、上
科学计算网格软件SCE的开发源于“超级计算环境建设与应用”,利用SCE将院超级计算环境中的总中心、分中心和所级中心互联起来,屏蔽底层高性能计算机的异构性,实现统一的资源管理
互联网具有极强的复杂性,因此要通过研究互联网的拓扑进而改进互联网的设计,改善互联网的性能,就必须对互联网的宏观拓扑进行研究。近年来人们在该领域取得了长足的进展,发现
实时系统对任务的执行时间有着苛刻的要求,因此需要保证系统在最坏情况下也能够满足时间需求,这就需要知道任务最坏情况执行时间(Worst-Case Execution Time, WCET)。Cache作
目前,旅游信息平台主要以旅游门户网站的形式存在,其中的功能千篇一律,主要包括“旅游景点介绍”、“酒店预订”、“机票预订”、“自驾游”、“旅游地导航”等功能。但随着
随着互联网的飞速发展,互联网病毒传播也随之成为一个全球性问题,为了更好地应对互联网病毒传播,有必要对互联网上的病毒传播行为进行深入的分析。互联网本身作为一个典型的
随着虚拟现实技术的发展、数字化人体运动仿真技术的日趋成熟,大规模人群运动仿真技术开始成为虚拟人合成领域新兴的研究热点。利用群体模拟技术,在计算机生成空间中创建并模
随着多核时代的到来,处理器运算能力的发展进入了一个黄金阶段。随之而来的“存储墙”问题也越发的严重了。在共享总线的多处理器体系结构中,内存是一个很重要的共享资源。多
随着信息技术的发展,人们在生产实践中需要处理的三维体数据日益增多。直接体绘制技术是三维体数据可视化重要的方法之一。它的最大特点是不需要从体数据中提取任何中间图元而
运行在网络环境中的软件系统通常由分布在不同网络节点上的软件实体组成,并基于一定的异步通信协议进行分布式协同工作,实现各种软件功能。对于这样的复杂软件系统,一致性测试仍