GPU加速的非结构自适应网格方法的研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:GoldGhost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文发展了一种GPU加速的基于非结构四边形自适应加密网格的二维无黏可压缩流动解算器VA2DG,以及带计算凝结问题扩展的解算器VA2DGC。网格自适应加密技术是计算流体力学中一项非常重要的技术,以前的研究者虽然在GPU上实现过类似的解算器,但是他们并未将自适应加密过程置于GPU上执行,这会带来频繁的数据交换问题并降低性能。本文第一次完全的在GPU上实现了非结构网格自适应加密方法,极大的减少了因在CPU上实现网格自适应所带来的GPU和CPU之间的数据频繁交换问题。本文采用加密网格表的方式实现了在GPU上高效运行网格自适应过程,并使用原子操作来实现加密网格表的并行生成,同时回收废弃的网格以提高存储空间的利用效率。  本文分别在CPU(Intel E7300)和GPU(Geforce GT9800和Tesla C2050)上模拟了三个典型的二维流动问题,将其结果对比理论解或者试验结果来检验该解算器的模拟结果是否正确,然后将GPU和CPU运行的时间相互比较来分析GPU解算器的性能。通过比对模拟结果可以发现GPU模拟的结果与文献中的理论解或者试验结果吻合得非常好,证明了VA2DG能在GPU上正确的模拟流体问题。基础优化代码使用GT9800运算时,对比E7300的结果可以达到8x的加速比。同样的代码在C2050上运行则能达到28x的加速比。通过在C2050上使用共享存储器原子操作和配置更大的L1缓存,优化代码能达到40x以上的加速比。本文重点关注了网格自适应加密过程的并行,这一过程使用GT9800可以达到3x的加速比,若使用C2050则可以达到28x的加速比,这也证明了网格自适应加密过程的GPU并行是可以高效实现的。这一结果同样可以证明GPU架构的发展可以对计算流体力学带来明显的益处。  在验证VA2DG解算器可靠性的基础上,本文将VA2DGC用于计算可压缩流动中的凝结问题,首先模拟了含水蒸气凝结的激波管问题,并与CESE算法计算的结果进行对比,用以验证VA2DGC程序的可靠性。然后本文模拟了10m×10m和100m×100m区域内含凝结的Prandtl-Meyer流动,并考察了稳定状态时流场中波系以及成核区域分布的情况,发现凝结产生的激波呈现不连续的分层次串级分布,而成核区域分布则会出现不规则的突起,这种不规则的突起是由于凝结过程的二维效应引起的。通过拟合发现突起区域离拐点的距离约是以四次方的比率增长的。
其他文献
在小学语文教学中,学生核心素养培养是非常重要的.而想要提高学生核心素养,教师需要重视小学生语文认知能力发展,帮助学生养成良好的学习习惯,学生学习的时候,态度必须端正,
本文通过对荣华二采区10
期刊
经典耦合热弹性理论得到的热传导方程是扩散型的,并且它所描述的热在介质中以无限大速度进行传播,这与物理实验观测相矛盾。随着科学技术水平的不断提高,广义热弹理论得到了广泛
小学音乐教学是学生了解音乐,认识音乐的基础阶段,它是学生的审美观念提升,创新思维与综合素养发展的推进剂,随着新课改的要求和深入,课堂创新有效教学理念已经广泛的应用到
近些年来红外成像技术在军事和民用方面都获得了非常广泛的应用,基于红外成像的装备和产品被广泛研制和开发。为了缩短研发周期,降低研发费用,利用计算机仿真来生成红外图像,
新时期,高校学生宿舍的生活条件得到很大的改善,宿舍不仅是大学生的生活场所,也逐渐成为重要的学习场所.对宿舍管理工作的要求从传统的日常服务逐渐向思政教育方向转变,同时
新型高性能电工材料因具有优异的性能和广泛的应用前景,为电工及相关行业的发展起到巨大的推动作用,其应用特性的建模问题是这些材料用于工程设计的关键问题。由于这些材料的物
基 于 Euler-Bernoulli 梁 理 论和Eringen 非 局 部 弹 性 理 论 建 立 了Winkler-Pasternak 弹性地基上变截面纳米梁在温度影响下自由振动的控制微分方程;基于经典薄板理论
随着世界能源及环境问题日益严峻,可再生能源研究开发已成为不可逆转的趋势,分布式发电作为最清洁的产能形式,已受到了广泛的关注。微网作为分布式电源的有效载体,其运行方式