基于多GPU的FDTD并行算法及其在电磁仿真中的应用

被引量 : 0次 | 上传用户:xincqu923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理论、实验与计算相结合已成为科学研究的基本模式,在电磁科学与工程领域中,时域有限差分(FDTD)算法已成为进行电磁场分析的重要方法。FDTD算法是一种麦克斯韦(Maxwell)方程组的时域求解方法,直接将电磁场按照Yee网格的方式进行离散,在空间及时域上利用中心差分近似Maxwell旋度方程中的偏微分,就可以实现电磁场在时域的交替递推。其实现简洁,易于理解,对各种形状以及各种材料的介质有着广泛的适应性;因为FDTD方法直接求解Maxwell方程组,所以各种电磁现象均隐含其中,因此其适用于求解电磁场的辐射、传输及散射等各种问题。自从1966年FDTD由Yee提出以来,也在不断地发展并已广泛地应用于各频段的电磁场仿真领域。作为一种差分方法,受到数值色散及数值稳定性的影响,为保证FDTD算法的精度,对网格划分有着较为严格的限制。一般其空间步长要小于波长的1/10,当物体结构更为复杂时,空间取样点更要足够多以尽可能真实地模拟物体,而时间步长要满足Courant稳定性条件,与空间步长相关。因此进行电大问题或者精细结构问题的计算时,FDTD方法往往是十分耗时的。FDTD算法具有天然可并行优势,因此进行并行计算可有效地减少计算时间,加速仿真设计进度。FDTD并行计算主要集中在基于网络设备的并行算法上,如超级计算机以及个人计算机集群,但由于成本及网络速度影响,这种并行方式的性价比并不高;基于可编程器件的FDTD并行算法也得到部分研究者关注,不过由于可编程器件的复杂性以及器件发展问题也并未得到广泛应用。近年来,图形处理器(GPU)受到游戏市场需求的带动以超过摩尔定律的速度发展,而且其浮点运算能力远高于同时期CPU的运算能力,所以GPU在通用科学计算领域中的应用也逐渐受到关注,如今随着通用图形处理器(GPGPU)技术的迅速发展,GPU已广泛应用于各种通用算法以及各领域的科学计算中,在电磁计算方面特别是FDTD算法上的应用得到了研究者的广泛关注。计算统一设备架构(CUDA)模型出现以后,使得通用图形处理器并行程序的开发更为快速高效,受到科学研究者的欢迎并迅速应用于各学科的计算领域。本论文研究课题来源于国家重点基础研究发展计划项目:金属/介质纳米异质结构中的局域耦合效应及其在光电转换器件中的应用,本论文研究内容为其中的应用GPU技术进行发光二极管(LED)并行仿真计算系统研究部分,主要研究了基于GPU的FDTD并行算法,最终实现了多GPU平台上的FDTD混合并行运算,极大地提高了利用FDTD算法进行电磁仿真的运算速度,已应用于LED的仿真设计中,进行了LED发光增强研究。论文主要分为以下几个部分:首先,本论文对研究相关的基础做了介绍,包括电磁计算以及并行计算基础,说明了本文的研究意义以及主要内容,然后对并行计算技术进行了研究,分析了各种并行方法的特点,并对GPU以及通用图形处理器技术的发展应用作深入探讨,研究了CUDA模型的软硬件基础以及编程模型,最终选择CUDA模型作为研究FDTD并行算法的基础。其次,本文研究了基本FDTD算法原理以及相关知识,如数值色散、边界条件以及激励源等,然后讨论了并行FDTD计算的发展现状,引出本文所要研究的具体内容。论文提出了一种在CUDA架构下二维及三维FDTD并行算法的实现方式,并实现了二维FDTD算法的各向异性完全匹配层(UPML)吸收边界条件,以及三维FDTD算法的UPML和卷积完全匹配层(CPML)吸收边界条件,实现的入射源包括二维线电流源,三维偶极子源以及平面波入射源,并且在平面波入射源的加入中也实现了一维Mur吸收边界条件的FDTD并行算法。本文提出利用二维线程组织控制电磁场的递推的方式处理二维问题,并提出了多种存储器访问优化方案,包括共享存储器的两种访问方式以及纹理存储器的使用等。在处理三维问题时,本文提出并实现了两种线程组织方案,并对两种方案进行了优化,对比了其计算速度,相对于传统CPU串行算法均达到了10倍以上的加速比。针对UPML和CPML的不同特点,本文采取了扩展PML以及分立计算的不同处理方式,并采取了相应的优化方式,在保证计算精度的前提下,均实现了较高的计算速度,与串行算法相比普遍达到20倍以上的速度提升,最高达到了58倍的加速比。在单GPU并行计算的基础上,本文将并行算法扩展到多GPU平台。采用FDTD区域分解以及合理的边界交换方案,并利用GPU与CPU内存之间的同步数据传输方案实现了FDTD算法的多GPU并行,为降低数据传输的影响,本文针对多GPU的FDTD算法提出了异步数据传输方案,经验证本方案能够有效地提升多GPU的并行效率。首次实现了GPU内部并行计算,GPU之间并行计算以及数据传输与计算之间的任务并行的FDTD混合并行计算。本文对多GPU算法进行性能测试,包含10层CPML的FDTD算法,在8块GTX295组成的计算平台上达到了4000Mcells/s以上的运算速度。本文利用GPU运算平台研究了三维FDTD算法中CPML各参数对其吸收效果的影响,进行了微带天线以及滤波器的仿真分析。本文提出了利用FDTD算法计算偶极子辐射功率的方法,在多GPU平台上进行了验证,并利用此方法计算了LED模型的辐射光功率,并利用顶部光子晶体提高了其辐射功率。
其他文献
近年来,石斑鱼人工繁殖及苗种培育工作取得了较大进展,基本克服苗种生产难关,能够获得相当数量的商品规格鱼苗,但是大批量生产技术还不稳定。本文依据已有的石斑鱼池塘育苗技
本文总结了我国石材加工设备行业的发展现状,分析了石材加工设备的市场情况,提出了我国石材加工设备未来发展空间巨大。
简要阐述了水库大坝安全监测对大坝运行管理的重要意义,介绍了大坝安全监测的范围、方法和重点,对大坝的长期安全运行管理有一定的借鉴作用。
甘庄煤矿8303工作面采用"U"型通风方式,采空区漏风通道两端风压差造成采空区内部瓦斯涌出,从而导致工作面上隅角瓦斯积聚。针对这一问题,通过分析瓦斯来源及造成浓度超限的原
生产力与生产关系之间的矛盾运动是是社会发展的根本动力,而生产力在其中是决定性的因素,它的发展带来了社会历史的变革。智能化生产力体系作为知识经济时代生产力的集中体现
本文采用碱催化法,合成了烷基酚改性的水溶性热固性甲阶酚醛树脂,并以此为树脂,采用有机酯和轻质氧化镁作为固化剂制备出一种常温固化的高性能酚醛树脂粘结剂。研究了反应时
<正>随着中央八项规定、反对铺张浪费等措施的贯彻落实,一直以来"牛气冲天"的奢侈品行情明显下挫,一些品牌也暂时放缓在中国的拓展计划。眼下,公务人员消费奢侈品饱受诟病,"
谷氨酸是脑内最重要的兴奋性氨基酸,严重的脑缺血缺氧会导致其浓度显著升高,产生神经毒性效应。脑中缺乏谷氨酸的代谢酶,释放到细胞外液中的谷氨酸只能由谷氨酸转运蛋白重新
财务信息质量不仅影响公司利益相关者根据企业信息做出决策,更影响市场经济正常运行。目前,会计造假现象层出不穷。会计造假的主要原因是处罚力度不够,会计人员职业素质不高,
我国的建设工程监理制度从1988年开始试点,1997年国家颁布《中华人民共和国建筑法》(以下简称《建筑法》),以法律制度的形式推行工程监理制度。在二十多年的发展过程中,随着