论文部分内容阅读
FDTD(Finite-Difference Time-Domain时域有限差分法)是对与时间相关的麦克斯韦方程的直接求解。在电磁场问题的数值计算中具有广泛的应用。是目前射频器件以及光器件的计算机仿真的最有效的方法之一。在光器件的仿真中,由于光波长很短,考虑数值色散的影响,FDTD算法的空间步长一般小于λ/10,导致在进行电大尺寸器件仿真时所需计算网格数目相当庞大。对于光波导仿真,当波长变为微米级时,空间步长就非常短。对于三维光器件的仿真或者大型二维光器件的仿真,需要很大的存储空间和运算能力。对于这种大型的电磁场问题,单台普通PC已经不能满足很多情况下的计算要求。高性能的大型计算机价格又十分昂贵。由于FDTD算法具有天然的可并行运算的优势。将多台廉价的PC机通过网络组成能够协同工作的机群来进行并行FDTD的计算成为一种很好的解决方案。可以满足工业界对大型光器件仿真的要求。因此研究基于PC机群的并行FDTD算法的优化,并为FDTD应用研究一种低成本的并行计算系统确有必要。基于CPU的PC机群在处理光器件的FDTD仿真时,能够满足存储空间的需求,但是运算能力仍然不够强大,这就需要运算能力更加强大的专有硬件来负责运算。现代图形处理器GPU(Graphic Process Units)将数据流并行处理的概念引入硬件结构中,具有高性能的数据并行处理能力。由于图形图像处理相关产业的推动,GPU发展迅速,与CPU相比,价格不高,运算能力却高出几十到几百倍。GPU在大型电磁场FDTD计算中运算速度优势非常明显,本文将在第四章详细介绍并行FDTD在GPU上的实现。论文提出并实现了一种以GPU图形加速卡为核心,并由PC机群通过以太网络连接组成的FDTD的并行计算系统。通过使用最新Linux内核,采用远程网络启动技术,降低了并行处理单元的成本,提高了整个并行系统的可靠性。针对此方案开发了相关的算法和接口软件,克服了并行FDTD计算中的通信瓶颈问题。并从网格划分,CPU缓存(Cache)和流水线结构,网络驱动方面对并行FDTD算法进行优化,使得并行FDTD在进行光子晶体的仿真中达到了很高的加速比。针对本文提出了系统,开发了一整套基于以太网和基于GPU的并行FDTD计算程序包,包括数值算法程序和方便的人机界面程序。并针对一些光波导器件的特性进行了仿真和分析。对二阶FDTD算法进行了并行计算测试和优化,优化后得到了很高的并行加速比。仿真结果同样显示基于GPU的并行FDTD系统具有良好的并行特性,可在光波导器件时域分析方面替代昂贵的大型并行计算机系统。