论文部分内容阅读
随着高性能并行计算机技术的飞速发展,并行计算的应用日趋广泛,分布式存储机群系统也日益受到高性能计算领域的重视。与此同时,为了充分利用计算资源,提高并行计算效率,用户在使用机群系统时,迫切地需要一些性能分析与监测工具,能以可视化的方式表现并行程序性能特征,以便评价和改进并行算法。 本论文简要介绍了机群系统技术、性能分析与监测工具的提出和发展、常见性能分析工具分类及其当前研究现状。阐述了并行I/O的研究与应用,主要包括并行I/O文件系统、并行I/O分类和性能分析比较,以及并行I/O在性能分析与监测信息采集中的应用。 论文给出了基于机群系统的并行程序动态行为监测系统(PPDBM)的设计过程,详细介绍了PPDBM的实现方案,其中主要包括软件事件记录器的实现,进程各事件行为状态、各节点CPU状态及内存信息动态可视化显示,以及并行加速比、并行效率、计算/通信比分析数据的图形化显示。 最后,在自行搭建的机群系统上,用PPDBM系统对π近似值经典并行算法按不同节点数及不同问题规模进行了测试,对并行程序进程行为进行了实际监测和性能分析。