论文部分内容阅读
不同节点内GPU通信通道的性能可能会有很大不同.笔者提出了一种拓扑感知GPU选择方案,用于将GPU有效分配给节点内的MPI进程.分配有助于在更强大的通信通道上映射更密集的进程间GPU与GPU通信来提高通信性能.利用三个指标来区分不同的GPU到GPU通信通道:延迟、带宽和距离.在16GPU节点上进行大量实验评估方案,并证明此方案相对于默认GPU选择方案有相当大的性能改进,在微基准和应用程序级别上实现高达70%和21%的性能提升.