论文部分内容阅读
作为解决大规模计算问题的重要手段,高性能计算被越来越广泛地应用到科学与工程的各个领域。随着高性能计算的发展,高性能计算机规模的不断扩大,系统峰值性能得到迅速的提高。但是,应用程序获得的持续性能并未与峰值性能保持相同的增长速度,它们之间的差距越来越大。如何发现系统瓶颈,优化系统设计,提高系统持续性能是高性能计算研究领域中亟待解决的重点和难点问题。高性能计算中的性能评价技术是解决此类问题的一个有效途径和方法。由于机器体系结构和程序结构日益复杂,影响程序性能的因素越来越多,同时各种因素之间还存在着复杂的、非线性的交互作用,使面向高性能计算的性能评价面临着巨大的挑战。传统的性能评价方法由于自身特点已经不能满足这些复杂的大规模并行系统性能评价的需要,一种结合应用负载特征和机器体系结构特点的性能模型方法得到学术界和工业界的高度关注。这种方法独立分析应用的负载特征和机器的性能轮廓,并通过数学方法结合这两类参数评价系统的性能。本文围绕着“准确评价并行系统性能”这一根本目标,对高性能计算中的性能评价模型结构框架及其关键实现技术展开深入的研究。论文首先深入分析了国际上并行系统性能评价技术的研究现状和热点方法,重点研究了对并行系统性能评价有重要影响的研究项目,总结了它们的特点和不足。综合分析影响并行系统性能的众多复杂因素,针对一维空间性能度量尺度的不足,论文在多维空间上提出了并行系统性能度量体系,定义了基本性能指标AIM、SPF和SPMAO,给出了这些基本指标之间的距离和相似性关系,阐述了度量体系在并行系统性能分析中的作用。多维空间上的性能度量体系奠定了并行系统性能评价的基础,建立了实际并行系统到抽象数学空间的映射。论文分析了目前大部分并行系统性能评价模型特点,提出了一个并行系统性能模型框架PMPS(Performance Model of Parallel Systems)。该模型采用局部与整体相结合的层次式褶合方法,具有良好的可扩展性和开放性。为降低性能指标的维数,减少PMPS模型分析的复杂度。论文研究了处理器节点关键性能因素的提取技术,提出了一个有效的DoubleP方法。该方法将众多复杂的性能因素聚焦到几个性能主成份上,明确了分析的对象。通过DoubleP方法的分析,提取了14个影响处理器节点性能的关键因素和4个性能主成份。程序性能特征分析方法是PMPS模型中实现应用负载特征分析的主要手段,也是并行系统性能模型研究的难点问题之一。为实现程序性能特征的快速分析,论文提出了基于抽样的程序性能特征分析方法。与其它方法相比较,该方法在相同误差条件下有效减少了分析的指令数量,仅需抽样分析1%~3%的程序指令就能实现小于3%的分析误差。论文基于抽样方法实现了的程序性能特征分析器SamplePro。处理器节点性能模型是PMPS模型的重要组成。论文提出了一种基于多元线性回归的处理器节点性能求解方法和表示模型。该方法将性能因素和它们间的相关性转变成相互独立的一次预报变量,通过求解回归系数确定了程序中复杂的重叠操作时间和不同操作类型的权重。使用该方法构建的性能模型更加准确,误差分布均匀,不受处理器类型和负载特征的影响。通过本文的研究,实现了具有良好可扩展性和开放性的PMPS性能模型。该模型能准确评价各种并行应用在并行机器上的性能,可以有效发现并行系统的性能瓶颈,指导并行系统的设计、优化与升级。