论文部分内容阅读
高性能计算正处于一个新的快速发展时期,有两个现象值得关注,一方面,并行计算机的峰值性能提升迅速,峰值计算速度高达百万亿次的计算机系统已经被研制成功,高性价比的机群(cluster)成为高性能计算机的主流架构,促进了高性能计算在更多领域的普及应用;另一方面,并行应用软件缺乏,高性能计算机的实际效率长期以来处于较低水平,当前大型并行应用软件仅能发挥20%以下的系统峰值性能。 应用性能才是用户最关心的,也是最重要的。并行软件和应用水平已经成为高性能计算发展中的薄弱环节,应该给予更多的重视。并行计算机和并行应用程序是影响并行计算性能的两个主要方面,也是本文的研究重点。 本文以3个万亿次机群系统为平台,利用有着很强应用背景的NPB(NAS Parallel Benchmarks)进行性能测试分析。NPB程序包的8个程序都来自于实际应用领域,是科学计算领域并行应用的典型代表,NPB性能评测属于面向应用的性能评测,可以较真实地表现出系统的拟应用性能。 通过NPB测试,重点研究在大规模并行处理时(处理器数目达到上千个)系统的性能特点和趋势。分析了不同的处理器、互连网络等系统配置对NPB性能的影响,发现NPB的8个程序在3个万亿次机群上的性能特点和表现并不一致,表明国产高性能机群在设计上正在逐渐走出同质化的趋势,向多样化发展。进一步分析表明,目前NPB程序的可扩展性可以达到几百个处理器,但尚不能达到上千个处理器,NPB程序能发挥出的系统峰值的百分比仍然徘徊在10%左右,机群系统的并行可扩展性和应用程序对机器运算潜能的利用还需要进一步提高。对于处理器数目达到上千个的万亿次机群系统来说,对聚合通信和细粒度通信能力的支持亟需提高。 高性能并行计算在非数值领域有着广泛的应用前景。本文介绍了一个自主开发的基于MPI的并行数据挖掘系统(关联规则挖掘),在2个机群系统上进行了加速比性能测试,分析了程序的并行特点。结果表明,在非数值并行应用中,应当做好数据划分,精心设计优化数据结构,尽可能利用程序与易并行程序相类似的特点,这样可以有效减少进程间通信,实现负载均衡和同步计算,使得程序有较好的并行性能。