论文部分内容阅读
计算电磁学是设备电磁特性分析与设计的必要手段,当前精细仿真是电磁仿真的主流方向,然而这会对计算性能带来更大的需求。利用计算能力更强的平台来求解大规模电磁场问题是计算电磁学领域中的热点和挑战之一。异构集群相对于传统 CPU集群具有更强大的计算能力,“天河二号”超级计算机便采用了至强融核协处理器(MIC)。然而,目前还没有发现在CPU/MIC异构平台上研究计算电磁学问题的论文发表。本文选取了两种经典的计算电磁学算法,矩量法和时域有限差分法,将这两种算法应用到CPU/MIC异构集群上。 矩量法是电磁特性仿真计算中精确度最高的数值方法,同时也是一个计算密集、存储密集的数值方法。并行矩量法可大大加快求解效率,它采用了ScaLAPACK式的矩阵并行分布策略,利用MPI并行技术实现节点之间的通信。根据现有并行矩量法的程序分析结果和 MIC的硬件特性,利用offload编程模式加速矩阵求解部分。在MPI进程中利用OpenMP技术开起多线程,指定线程分配MIC上的任务以及传输数据。同时为了突破 MIC内存的限制,优化主机端同设备端的数据传输速率,进一步研究了“MIC卡上内存—CPU内存”的核外算法。通过设计双BUFFER的异步通信架构,来实现 MIC上通信与计算任务的重叠,到达缩短计算时间的目的,并对数据传输的方式和一些参数作了相关优化。最后矩量法的加速方案取得了良好的加速效果。 并行FDTD程序相对于并行MoM而言模块较少,在其加速过程中,借鉴在矩量法的工作经验,首先划分了CPU、MIC的任务数据。根据FDTD的程序特点结合测试数据设计了跨节点的并行方案,并优化主机端和设备端的数据传输,最后确定了CPU同MIC间同步通信的加速方案。