论文部分内容阅读
时域有限差分算法(Finite Difference Time Domain Method,FDTD)是求解麦克斯韦微分方程的直接时域方法,在电磁研究的各个领域获得了广泛的应用。但是其算法稳定性要求空间网格的最大尺寸应小于波长的十分之一。因此在复杂目标和电大尺寸情况下,较长的计算时间以及较大的存储空间成为限制FDTD算法应用的两个主要因素。
采用并行计算方法是提高FDTD运算效率的重要途径。随着计算机硬件性能的不断发展,尤其是图形处理器(Graphic Processing Unit,GPU)性能的大幅度提高和计算机统一设备架构(Compute Unified Device Architecture,CUDA)的出现,给FDTD并行计算提供了一个有效而简单的解决方案。
本文对基于计算集群的MPI(Message Passing Interface)和OpenMP(open multiple processing)和基于CPU+GPU的CUDA架构下的FDTD并行计算方法进行了性能分析、功能实现及优化。论文首先介绍了FDTD的基本理论,并且对其并行性进行了分析;然后分别介绍了并行计算理论中的MPI、OpenMp及CUDA的原理及实现方法;之后,在大规模PC集群环境下,实现了基于MPI和OpenMP的三维FDTD并行计算方法,并对并行计算的关键步骤进行优化;最后提出了一种利用CPU+GPU异构并行计算处理三维FDTD计算的综合方案,并在现有硬件平台上实现。
与传统FDTD计算性能的比较显示,本文的并行计算方法在扩大FDTD计算区域、提高计算速度等方面具有显著优势,可大幅度提高FDTD的计算效率和速度。