论文部分内容阅读
针对传统数据采集方法不足和Vtune的局限性,介绍了一种在多处理器环境下基于硬件性能监视器(hardware performance monitor,HPM)的并行计算性能数据采集方法,该方法基于集群和消息传递接口(message passinginterface,MPI)环境,利用应用程序性能接口(performance application programming interface,PAPI)采集CPU消耗的时钟周期数据。实验表明,采用该方法进行数据采样比传统方法精度高6个数量级,且跨平台性