论文部分内容阅读
研究高性能计算是为了计算模拟时间的缩短,并在有限的时间内增加试验次数,以促进包括工程学在内的其他各个领域的发展。相场法(Phase-Field Method,PFM)作为模拟共晶合金微观组织结构最有效的方法,采用统一的控制方程不仅避免了区分和跟踪固/液相及其界面,还可以将流场以及溶质场等外部场耦合到相场当中,但所建立的相场模型复杂,计算规模和计算量大,成为相场法发展的瓶颈之一。格子Boltzmann方法(Lattice Boltzmann Method,LBM)作为一种能够有效模拟流体的数值方法,已经被证明能够模拟包括气体,液体等多种流体的行为,并且适用于并行计算,广泛应用到包括模拟多相流,多空介质流等各个领域和工作中。本文基于相场模型与计算流体的格子Boltzmann模型耦合建立强迫对流下共晶生长的相场-格子Boltzmann模型(PF-LBM)。针对PF-LBM三维模型求解过程中存在的计算量巨大,模拟区域微小,无法在合理时间完成求解的问题。GPU计算为求解PF-LBM模型提供了有力支持。基于OpenCL开放、统一的编程模型,能够在异构系统上实现加速算法的优势,充分发挥GPU的运算能力,本文基于GPU-OpenCL的高性能并行计算方法实现PF-LBM三维模型的求解。主要开展工作和结论如下:(一)对PF-LBM模型进行可并行化分析,分析影响GPU-OpenCL并行计算方法性能的因素,针对GPU与CPU之间数据传送开销大的问题,将PF-LBM模型部署到单个GPU上进行计算。在单个高性能GPU上,采用GPU-OpenCL并行计算方法的求解结果与经典理论值相符,得到12.9X倍的性能收益,证明了GPU-OpenCL并行方法求解PF-LBM模型是有效的。(二)由于GPU对数据读取受GPU内存限制,设计GPU内存连续访问性高的内核的优化方案提高计算速率,主要采用Halo Therad的线程块优化手段,得到最佳的GPU-OpenCL程序,获取最大的性能收益,相对于串行CPU码实现,最大达到136.X倍的加速比,将计算效率提升了两个数量级,解决了因计算能力限制而无法较大规模的开展PF-LBM模型三维数值模拟的难题。(三)在单GPU上,GPU-OpenCL并行计算方法将PF-LBM模型的计算规模扩大2倍,计算规模达到??17031474。在较大规模的相场模型中,GPU-OpenCL计算模型不仅拥有更好的计算效率,而且得到新的实验结果:液流急剧改变共晶组织形貌,当共晶层片间距较大时,液体环状流动明显,在体积较大?相界面前沿未发现异相形核的生成,环状液流对?相的两侧生长速率有较大影响。