NS方程在GPU上的并行实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:qlj403740087
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,GPU性能飞速提升,越来越多的行业利用GPU进行一般意义上的科学计算(General-Purpose Computation on Graphics Processing Unit,GPGPU)。在航空领域,随着准确度、复杂度要求的提升,CFD计算耗费了大量的时间,国外许多专家利用GPU卓越的运算性能进行CFD计算,并行求解NS方程。单块GPU上取得的加速比一般有10到30倍,这样的加速比对于传统的集群计算来说是非常大的,由此造成的对CFD计算方式的影响不可谓不巨大。国外一些商用CFD软件ANSYS、Autodesk和开源软件如OpenFOAM等也纷纷开展GPU研究。与此同时,国内缺少成功的例子对利用GPU并行求解NS方程的可行性、有效性进行验证,在平常的科学计算和工程计算中,更是缺少相关的案例。这种情况大大阻碍了GPU并行求解NS方程在国内的推广。本文针对目前国内利用GPU并行求解NS方程的现状,设计并完成了GPU上并行求解NS方程的算法,目的在于验证利用GPU并行求解NS方程的可行性、有效性,有助于引进国外先进的计算技术,提高航空领域的CFD计算技术和能力。着重进行了以下工作:(1)研究了已有程序对完整考虑可压缩性和黏性的NS方程的数值求解方法;(2)设计并完成了GPU上并行求解NS方程的算法,采用大量优化技术对程序性能进行了调优;(3)对比了ORENA M6机翼和某机翼的跨声速流动的串并行计算结果,并给出了结论。对比ORENA M6机翼和某机翼的串并行计算结果,得出并行计算的结果是正确的。M6机翼在244800(51×30×160)的网格规模上取得了24倍的加速,某机翼在1676480(208×65×124)的网格规模上取得了37倍的加速,说明了GPU并行求解NS方程的巨大收益和良好的可扩展性。综上所述,本文的工作验证了利用GPU并行求解NS方程的可行性、有效性和良好的可扩展性。
其他文献
论文首先介绍了二维参数化绘图的发展与现状,分析了当前二维参数化绘图的几种主流技术:变量几何方法、采用约束谓词的几何推理方向、数据关联驱动方法、辅助线参数绘图法,并
该文围绕开发一个电子样机装配模拟仿真原型系统进行了全面深入的研究.首先,该文对系统的开发支撑软件系统--CATIA的体系结构进行了概括性的介绍,详细地总结了CATIA提供的ASD
传统优化算法能够充分利用问题本身所提供的信息与邻域知识,在搜索空间中从一个初始点按照某种确定的原则去寻找下一个迭代点,搜索过程具有针对性,而且收敛速度快、局部寻优
辐射测温低温区的温点数据可以通过黑体炉来标定,目前黑体炉所能标定的温度上限约为3000℃,而对于黑体炉无法达到的高温温区的标定就只能通过一点标定或外推标定的方法来解决,本课题旨在使用趋势外推的方法来解决黑体炉无法达到的高温温区3000 ~3500℃的标定问题。辐射温度计通常将黑体炉的辐射出度信息转化为电压量,而辐射出度信息与黑体炉的温度有关,本文所谓的标定就是建立辐射温度计的测量电压与黑体炉的温度
语音识别技术是近几年来语音处理领域出现的一个关键技术。语音识别的目的就是研制出一种具有人类听觉功能的机器,以便能够直接听懂人的讲话,并做出相应的反应。这种具备了语
学位
精密计量测试是现代制造的三大支撑技术之一,是高端制造技术的核心。在角位移测量领域,小尺度光学测量方面的主要问题是如何克服衍射极限,大尺度研究方面的主要问题是在测量
干涉检查与处理是数控加工自动编程是一个重要内容,作者结合超人CAD/CAM集成系 统的研制开发工作,对二、三坐标数控加工编程及其干涉检查与处理技术作了深入的研究,论文主要
防火墙技术作为计算机网络安全技术体系结构中的一个重要组成部分,在保护网络安全过程中发挥了关键的作用。但是,由于众商家在开发防火墙产品时,都不可避免的要考虑到其产品的通
目的:探析克氏针联合钢丝套圈型固定治疗断指再植骨折的效果.方法:选取2016年5月-2018年3月在我院接受治疗的50例断指再植骨折患者作为主要研究对象,随机将其分为2组,25例/组