论文部分内容阅读
尽管高性能计算机性能提升越来越快,但由于其体系结构的复杂性和微处理器的复杂性,并行应用程序普遍存在性能问题,许多实际应用的持续性能通常只能达到机器峰值性能的5~10%,因而并行应用性能优化一直是高性能计算领域关注的焦点之一。本文主要从如何提高并行程序的单任务执行效率角度进行并行程序优化的探讨,以基于JASMIN 框架实现的Euler 为例,探讨并行程序在Xeon 微处理器平台上的具体性能问题和指令级性能优化方法,并完成了Euler 程序的优化。优化后程序中的核心模块gas1dapproxy 执行时间缩短了一半以上,总运行时间减少了21~34%。性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进。