多松弛LBM并行及其在地下水流动模拟中的应用

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:zzw200512168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
格子玻尔兹曼方法(Lattice Boltzmann Method,LBM)是一种数值模拟方法,它建立在统计力学与分子运动论的基础上,架起微观与宏观、离散与连续的桥梁。该算法简单,易于实现,能够处理复杂的边界条件,且实验效果好。为了减少LBM模拟时间,本研究将并行技术与LBM结合并应用于流体模拟。在并行算法前,我们需要选择LBM模型,确定流体模拟的基本过程。按照松弛时间的不同,LBM可分为单松弛时间模型(single relaxation time,SRT)和多松弛时间模型(multiple-relaxation-time,MRT)。由于MRT模型模拟精度高、迭代次数少,能有效降低非物理震荡,具有更高的数值稳定性,因此本文以三维地下水流动为测试用例,采用D3Q19多松弛LBM模型对流体进行模拟。在MPI实现多松弛LBM(MRT-LBM)的并行过程中,我们将整个网格沿X方向进行数据划分,实现进程间的负载均衡。然后,我们详细分析了MRT-LBM算法的可并行性,找到所步骤间的依赖数据。再者,选用阻塞和非阻塞两种方式进行消息传递,只通信相邻格点所需的5个方向的数据,同时使用记数参数的方法减少通信开销,最终实现了算法的双节点多进程并行。实验结果表明,MPI程序具有一定的可扩展性,随着CPU核心的增加,加速比也在逐渐增加。针对密集型任务,单个GPU比单个CPU具有更强大的计算能力。因此本文在阻塞型MPI程序基础上结合CUDA实现了双节点多GPU的MRT-LBM算法并行。我们将整个离散网格均衡划分给每个CPU核心,一个CPU核心调度一个GPU设备,多个GPU同时计算,进而实现了双节点多GPU的并行。实验结果表明,在4个P100 GPU和4个Intel(R)Xeon(R)E5-2620 v4 CPU组成的集群环境下,加速比达到了182.66倍,其效果明显好于同等CPU数量的MPI并行。为了减少MPI通信时间和上下文切换的延迟,我们在阻塞型MPI+CUDA的基础上使用OpenMP技术在节点内以线程替换进程的方式,进而实现了MRT-LBM算法的多级并行。实验结果表明,在4个P100 GPU参与计算的条件下,阻塞型MPI+OpenMP+CUDA多级并行比阻塞型MPI+CUDA并行计算效率提高了8%以上。
其他文献
通过对完整经历过一轮浙江省新高考改革学生进行调查研究后发现:新高考改革带给学生的体验是多元的,其中,积极体验者占37.6%,消极体验者占45.3%;对“7选3”选考模式体验良好
本文对三相泡沫的流变性进行了实验研究,考察了剪切速率、固相(膨润土)含量、气体介质、泡沫特征值、温度对泡沫粘度的影响,导出了联系表观粘度与固相含量、剪切速率的幂律型关系
众所周知,变式教学一直是中学数学教学的有效手段.特别是在复习教学和综合知识的运用中,变式教学已经成为高效教学的代名词.变式教学法,是利用/系列构造变化去体会知识运用的
阐述了羊伪狂犬病的发病情况、临床症状、发病原因、诊断技术、防治措施及治疗体会,供养殖户参考。
紫外光照射对硫酸盐还原茵有杀菌作用,杀菌效果与化学杀菌剂1227和 WG-85相同,对油田配水间的注入水和浊度36、含油4ppm、呈棕褐色的污水中的硫酸盐还原菌也有杀菌作用。
报道了采自河北省7种地衣新记录种:裸果猫耳衣Leptogium hildenbrandii、变兰猫耳衣L.cyanescens、薄刃猫耳衣多叶变种L.moluccanum var.myriophyllinum、颈外蜈蚣衣Hyperphyscia
目的:探讨miR-135b(微小RNA-135b)和LZTS1(亮氨酸拉链肿瘤抑制基因1)在肺癌组织中的表达及其临床意义。方法:将2014年3月至2017年6月期间在六安市人民医院进行手术治疗的81例
振兴中医的关键在于中医人才的培养,而实用型医学人才需要有创新精神,需要创造力。医学教育,特别是非中医专业的中医教学如何面对医学人才市场,适应需求,取得最佳效果呢?具体方法
采用熔化极电弧增材工艺制备了成形良好的18Ni马氏体钢单墙体,研究了增材构件热处理前、后的组织力学性能.结果表明,增材构件的微观组织主要是柱状树枝晶,沉积态增材构件组织