LBM多相流大规模异构协同众核并行算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:chino80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
格子玻尔兹曼方法(Lattice Boltzmann method,LBM)是计算流体力学(Computational Fluid Dynamics,CFD)中广泛使用的方法,具有天然的并行性,尤其适合大规模并行计算。近年来,高性能计算机技术在不断的发展,采用异构众核处理器作为加速部件的异构众核超级计算机已渐渐成为主流。本文在典型的异构众核超级计算机天河二号上,针对开源3D多相流LBM软件OpenLBMFlow开展了大规模异构并行计算研究。主要工作和贡献如下:(1)对基于格子BGK和Shan-Chen模型的LBM多相流算法和OpenLBMFlow程序实现进行了深入剖析,根据典型异构并行体系结构平台特点,设计了多层次的LBM流场区域分解方法。分别从任务层、异构协同层、数据层、指令层方面描述了LBM多相流模拟的多层次多粒度并行性,提出了大规模异构协同众核并行算法,并对算法的性能瓶颈进行了理论分析。在此基础上从通信、负载均衡以及LBM算法层面提出了相应的优化策略。(2)在天河二号超级计算机上,采用OpenMP4.5加速器模型,实现了OpenLBMFlow基于MPI+OpenMP4.5+SIMD的CPU+MIC异构协同并行模拟。首先通过一系列串行代码优化大幅提升了CPU和MIC上LBM代码的单线程效率,相比于基准测试代码分别获得了2.5和2.8的加速比。进行SIMD优化后,CPU性能进一步提升了1.5倍,MIC性能则提升超过2倍。通过负载均衡优化和异步计算通信重叠,与纯CPU并行模拟相比,异构协同取得了不错的性能加速比。以128个节点结果作为基准,程序在2048个节点时获得了超过80%的效率,展示了不错的弱可扩展性。(3)探索了Python大规模高性能计算和性能优化方法,实现了国际上首个完全基于Python的大规模并行三维LBM多相流模拟开源代码PyLBMFlow。根据Python语言特性,提出了一系列性能优化方法并对LBM边界算法进行了重构,大幅提升了Python计算效率,优化后串行性能相对于基准实现提升达两个量级。在此基础上,基于Mpi4py和Cython实现了MPI+OpenMP混合并行,在天河二号超级计算机上成功模拟了LBM气液两相流,并行规模1024结点,并行效率超过80%。
其他文献
结合作者实际的工作经验和培训学习心得,阐述药物临床试验机构资格认定复核准备工作的体会,认为要顺利通过资格认定复核检查,应该针对本机构药物临床试验项目实施情况,组织学习、
目的 探讨小切口髓内钉内固定术在治疗股骨骨折中的应用及其疗效。方法 应用小切口直接复位加髓内钉内固定术治疗股骨骨折17例,观察其疗效,并随访。结果 17例全部随访,并于第4周
本世纪六十年代,美国黑人民族、民权运动风起云涌,“black”(黑色)一词成了美国黑人民族自尊的象征。1976年,美国黑人作家A·哈利出版的长篇小说《根》,掀起了美国黑人寻
采用射频等离子体增强化学气相沉积(RF-PECVD)法在低温、低功率的条件下制备了一系列本征硅薄膜,研究了硅烷浓度(CS)对薄膜微结构、光电特性及表面钝化性能的影响.将本征硅薄膜作
Pd-Pt双金属基甲烷氧化催化剂的催化活性、抗水热老化性和耐硫性在一个通有模拟稀燃天然气汽车尾气成分的固定床反应器中进行检测.研究发现Zr掺杂的Pd-Pt/Al2O3(Pd-Pt/Zrx Al(1
心血管疾病是一种严重威胁着人类健康的常见病,Ca^2+-CaN-NFAT信号通路在心血管疾病中的影响国内外已有很多文献报道,是近年来治疗心血管疾病的热点,本文就此Ca^2+-CaN-NFAT
目的探讨闭合复位交锁髓内钉治疗胫骨骨折的可行性。方法本组应用闭合及开放复位带锁髓内钉治疗闭合性胫骨骨折246例,闭合穿钉组98例,开放穿钉组148例;两组术后均内服中药桃红四
从1983年到2019年,央视春晚已经举办了36届。作为中国春节不可缺少的仪式化节目,央视春晚伴随了几代人的成长,具有特殊的地位和意义。几千年来,中国人民书写了一个又一个伟大
三、强调句或指示句“it is+强调或指示部分+that”这种句子历来叫做强调句,新近有人认为应是指示句。下面暂且沿用旧名。对一个句子中的某一部分(通常是由名词或代词构成的
钚是元素周期表中最为复杂的元素,呈现出众多奇异的性质,准确理解其电子结构己成为凝聚态物理的一个挑战.此外。钚会发生化学老化和物理老化,使得其材料性能随时间而变化,准确获得