流场的格子Boltzmann模拟及其GPU-CUDA并行计算

来源 :大连理工大学 | 被引量 : 17次 | 上传用户：xh7304

【摘要】

：

格子Boltzmann方法(Lattice Boltzmann Method,LBM)是一种有效的模拟复杂流体流动的数值计算方法,已经成功的应用到研究多相流,多孔介质流和湍流等工作中。与传统的数值求解

【作者】

：

李承功

【出处】

：

大连理工大学

【发表日期】

：

2013年01期

【关键词】

：

LBM MRT-SMAG模型 GPU-CUDA并行计算方腔流风生流

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

格子Boltzmann方法(Lattice Boltzmann Method,LBM)是一种有效的模拟复杂流体流动的数值计算方法,已经成功的应用到研究多相流,多孔介质流和湍流等工作中。与传统的数值求解宏观方程(Euler方程和Navier-Stokes方程)方法相比,LBM是从介观动理论的角度,将流体抽象成大量的介观粒子,这些粒子在简单的网格上进行迁移和碰撞,通过对反映粒子分布的统计函数进行时空演化获得流体的宏观变量。因此,LBM具有边界条件易于处理、代码短小、编程简单与适合并行计算等优点。随着近年来科研工作者们对LBM越来越多的关注以及对LBM不断的发展和应用,LBM已经逐渐发展成为计算流体动力学中的一个重要研究热点。为了求解高雷诺数不可压流场,本文将Smagorinsky涡粘性模型拓展到LBM中的二维9速度(D2Q9)和三维19速度(D3Q19)多松弛时间(Multiple Relaxation Time, MRT)格子Boltzmann模型中,针对LBM数值模拟高雷诺数三维流场计算效率低的问题和其非常适合并行的优点以及基于中央处理器(Central Processor Unit,CPU)并行计算的限制,采用基于图形处理器(Graphic Processor Unit,GPU)的计算统一设备架构(Computing Unified Device Architecture,CUDA)并行编程模型对已建立模型进行并行加速,并利用建立的并行模型对方腔流和风生流进行了数值模拟研究。本文的主要工作如下：第一,介绍了LBM的发展历史,基本原理和模型,边界条件,单位转换以及数值实现过程。为了模拟高雷诺数的不可压流场,本文利用传递矩阵把粒子分布函数的二阶矩从速度空间传递到矩空间计算涡粘性系数的方法,将Smagorinsky涡粘性模型拓展到D2Q9和D3Q19MRT格子Boltzmann模型中,建立了D2Q9和D3Q19MRT-SMAG模型。第二,针对LBM数值模拟高雷诺数三维流场计算效率低的问题和其非常适合并行的优点以及基于CPU并行计算的诸多限制,本文采用基于GPU的CUDA并行编程模型对拓展的MRT-SMAG模型实现了并行加速。该部分介绍了GPU-CUDA并行编程模型,提出了基于GPU-CUDA并行计算在MRT-SMAG模型中的具体实现过程。通过对基于GPU并行程序性能的具体分析,可以通过合理分配线程块内线程数量,减少内核函数内的if判断语句,尽可能多的运用片上高速的共享内存等,以提高GPU上并行程序的计算效率。为了验证已建立并行程序的准确性,本文完成了长宽高比为1：3：1,Re=10000的三维单边驱动方腔流的数值实验,在该算例中基于GPU并行程序的计算效率与只用单个CPU进行计算的串行程序相比提高达145倍,由于在GPU和CPU上都采用双精度计算,而两者的计算精度没有差别。第三,为了进一步验证基于GPU并行模型的准确性和评估该模型求解湍流的能力以及分析多边驱动方腔内的流场特性,本文针对方腔流研究中存在的问题应用已建立的基于GPU-CUDA的D2Q9和D3Q19MRT-SMAG模型对二维和三维单边驱动方腔流以及多边驱动方腔流进行了数值模拟研究。对于二维方腔流,分析了腔内流场由层流向湍流状态转变的转捩雷诺数,讨论了格子网格系统,Smagorinsky常数,初始发展阶段和时间平均阶段对高雷诺数二维方腔流(雷诺数从5×104到107)时间平均量的影响；对于三维单边驱动方腔流,计算了三维方腔层流初始阶段流场,分析了边墙摩擦对三维方腔内湍流场的影响,讨论了表征其湍流脉动强度的二阶统计量；对于三维四边驱动方腔流,分析了宽高比对腔内流场特性的影响,计算了多个稳定层流解(流体分岔),讨论了宽高比对多个层流稳定解的影响,另外还评估了基于GPU并行程序对各算例的计算效率。第四,采用建立的基于GPU并行模型对三维风生流进行初步的数值研究,分析了中心对称断面的不同位置处的时间平均水平速度曲线以及表面和底部近壁区内的速度分布,给出了中心对称断面的时间平均流线和速度矢量,并将数值结果与已知的实验结果进行对比验证,结果表明MRT-SMAG模型可以求解三维风生流,和利用CUDA并行编程模型在GPU上可以极大的提高该模型的计算效率,约为178倍。

其他文献

急性下壁心肌梗死的梗死相关动脉心电图分析

目的旨在对急性下壁ST段抬高型心肌梗死早期不同导联ST段变化的心电图与冠状动脉造影对比的回顾性分析，探讨以ST段变化判断其梗死相关动脉及闭塞部位。方法81例急性下壁ST段抬

学位

急性下壁心肌梗死心电图梗死相关动脉冠状动脉造影术

月经过少病古代文献研究

选取妇科代表性著作,收集、整理与月经过少病相关的内容,探讨古代文献对月经过少病的病因病机、治法方药等辨治规律的认识,为临床治疗提供思路。认为月经过少病的核心病机以

期刊

月经过少阴血亏虚四物汤古代文献

硫化氢对大鼠烧伤后炎症反应影响的实验研究

目的分析大鼠烧伤后血清中硫化氢（Hydrogen Sulfide，H2S）的变化及烧伤后炎性因子C-反应蛋白、IL-6及总抗氧化能力在不同H2S水平下的变化，从而探讨H2S对烧伤后早期炎症反应的影响，

学位

烧伤硫化氢炎症C-反应蛋白IL-6总抗氧化能力

关联詞语的性质

关联词语的命名,是因为原称的关联词不能包括起关联作用的词组而定的。有了关联词语的名称,固然可以使我们知道在复句中起关联作用的不仅是词还有词组;但是在具体应用上,这

期刊

关联词语动宾结构关联词组介词结构时间名词

“开在生命炼狱边的小花”——曾卓《悬崖边的树》和《我遥望》赏析

在以阶级斗争为纲的年代,不少诗人受到不公正的待遇,曾卓也不例外。在1955年那场震惊中外的“胡风反革命集团”冤案中,他受到了严重的迫害,被卷入风暴的中心。他先是在铁窗

期刊

《悬崖边的树》

反对进步观的达尔文阅读生物学札记之三

<正> 在近现代人类思想的殿堂中,"进步观"是最重要的支柱之一。概言之,为之催生的是两支力量。其一,告别中古时代后,人类的社会与文明猛然从静态变为动态,从缓进变为疾行。这

期刊

古尔德生物学生物学家

中医肿瘤规范化治疗与个体化治疗临床研究

中医药是肿瘤综合治疗的重要组成部分。现代中医肿瘤学起步于二十世纪六十年代,通过开展扶正培本法配合肿瘤放化疗减毒增效、扶正解毒法治疗晚期肿瘤以及扶正活血解毒法控制

期刊

肿瘤规范化治疗个体化治疗中医临床研究

广西旅游经济影响力分析

文章运用收入弹性、区位熵、旅游需求收入弹性、旅游的产业地位指数等,对广西旅游业的经济影响力作了简要分析。

期刊

广西旅游经济影响力分析

对通过受精卵移植传播的疾病防疫(2)

<正>对由受精卵移植传播的疾病防疫有二个方法,一个是根据供卵动物(母牛和公牛)的健康状态,另一个是根据受精卵的卫生状况。根据供卵动物健康状态的防疫方法,是一常规的方法,

期刊

受精卵移植传染性疾病培养液病原体疾病防疫

统一公平与效率的城镇化发展路径

加速城镇化发展是当今中国经济转方式、调结构的关键所在。根据历史经验,由政府主导培育中心镇,是在城镇化进程中统一公平与效率的主要路径。它可以在推动城镇化同时,促进城

期刊

中心镇城镇化扩权强镇公平与效率的统一

流场的格子Boltzmann模拟及其GPU-CUDA并行计算

与本文相关的学术论文