区域尺度地震波高效并行谱元求解器

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:DKarson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地震波数值模拟在天然地震学及地震勘探等领域发挥着重要的作用,得到了众多科研机构与物探公司的高度关注。本文着力研究区域尺度地震波高效并行谱元求解器,主要分为地震波方程高效时空离散格式及其并行实现两个方面。  在格式方面,我们采用谱元方法和显式全局时间推进格式离散地震波方程。在此基础上,提出一种单元刚度矩阵分解策略优化地震波方程谱元格式,显著降低了地震波方程谱元格式的计算量与存储量。进一步,提出一种局部时间推进策略克服显式全局时间推进的稳定性限制引起的全局时间步长过小问题,很好结合了地震波方程谱元格式,有效提升了地震波方程谱元格式的计算效率。格式覆盖了弹性波方程及声波方程,并考虑了各向异性、粘性、耦合、震源等因素,同时使用了完美匹配层方法来实现无反射边界条件。数值实验验证了格式的正确性和高效性。  在并行实现方面,首先,我们基于三维并行自适应有限元程序开发平台PHG的六面体版本,考虑到谱元格式的特殊性,简化了分布式并行数据结构,同时优化了并行性能,最终给出了谱元格式的MPI并行实现及MPI+OpenMP混合并行实现。在天河2号超级计算机上,谱元格式的MPI并行实现扩展到98304个CPU核,1500多亿自由度,并行效率(相对24个CPU核)达到98.01%,具有近乎完美的弱可扩展性。谱元格式的MPI+OpenMP混合并行实现扩展到98304个CPU核,1500多亿自由度,并行效率(相对24个CPU核)达到89.62%,具有良好的弱可扩展性。其次,我们在谱元格式的MPI并行实现基础上将算法热点加载到MIC卡上进行加速计算,给出了谱元格式的CPU+MIC异构并行实现。在天河2号超级计算机上,谱元格式的CPU+MIC异构并行实现扩展到820800个MIC核,1800多亿自由度,并行效率(相对171个MIC核)达到85.50%,具有良好的弱可扩展性。我们基于GPU的计算架构,利用了CUDA C编程和性能调优,给出了谱元格式的CPU+CPU异构并行实现,实现了单GPU卡对单CPU核的136倍的加速效果。此外,我们还基于国产众核的计算架构,采用了流水线结合双缓存的计算策略,对算法热点进行了从核化。算法热点从核化的加速效果是明显的。其中,遍历单元计算部分从核计算对主核计算的加速比达到24.45倍。最后,我们通过数值算例验证了求解器的有效性。
其他文献
该文应用动力系统的局部分支与混沌理论,研究几类连续和离散动力系统的动态当参数变化时产生的复杂动态,在这些系统中出现静态和动态分支以及混沌动态,其中包括saddle-node分
该文针对这种线性(观测)模型下的最小方差估计问题进行了深入讨论,指出这两种估计性能之间的关系及差别,从而为选择恰当的估计方法提供理论依据.在一般线性模型(即输入矩阵为确
该文研究来自渗流理论和人口动力学理论等应用领域中的一类带有非局部源项的退化抛物型方程解的定性性质,内容包括古典解的存在唯一性,解的整体存在性和有限时刻爆破,爆破点
给定一定义在域k上的射影曲面X上的双有理变换f:X--→X,则它的动力度λ(f)是可以测量f的动力学复杂性的正实数。本文主要是对前人的结果进行了整理,做一综述。他们研究了:当f跑
该论文主要研究定义在有界区域上的抛物型偏微分方程及方程组的临界爆破,熄灭指标.定义在无界区域上的抛物问题的临界爆破指标,即Fujita指标,已被广泛地研究:参见综述文献[DL
该文研究了某些系统的可积分的稳定性问题.所研究的稳定性包括:近似旋转变换的KAM不变环的时间常数与粘性,以及这类变换的有效稳定性.也对某些近似可积分微分方程转变及范数(
2月5日,农业部确诊并公布江西贵溪市志光镇皇桥村道家堂飞龙生态养殖场发生一起高致病性禽流感。疫情发生后,为了在最短的时间里有效控制疫情,志光镇广大党员干部舍小家为大
描述了应用于《可编程控制器原理及应用》课程中的FP辅助实验教学系统(FPAS)的设计与实现.作为可编程控制器(PLC)的一种仿真应用软件,采用了面向对象的编程思想并引入了UML对系统
实践证明GRACE能够检测到大尺度和较大量级的重力变化,但是无法获得高精度和高空间分辨率的中短波重力场,大气和海洋固体潮变化等高频误差的混叠效应是制约GRACE地球重力场精度
引言rn高考关系各环节的操作程序、各程序的制度完善,是实现高考报名工作规范化、现代化、高效化的唯一途径.笔者结合千百万考生的前途命运,关系着千家万户的切身利益,更关系
期刊