基于GPU群的大型稀疏线性方程组JPCG并行求解

来源 :第十届南方计算力学学术会议 | 被引量 : 0次 | 上传用户:Shauphei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  通用图形处理器GPGPU(简称GPU)具有超强的浮点运算能力,基于GPU的并行计算成为当前的研究热点.预处理共轭梯度法PCG是求解大型稀疏线性方程组最为高效的迭代法之一,其中Jacobi预处理共轭梯度法JPCG的错误!未找到引用源.并行化程度高,最适合GPU并行求解,在单GPU、多GPU和GPU群上都容易实现并行.JPCG迭代过程中涉及稀疏矩阵与向量的乘积运算(SPMV).在多GPU和GPU群上,SPMV需要其他GPU产生的有关向量元素.考虑到多GPU和GPU群并行都属于粗粒度并行,且诸如有限元空间离散系统的刚度矩阵中各行的非零元素个数很有限,本文按结点坐标对空间离散系统的结点进行重排序,实现粗略的带宽优化,使得在“粗粒度”意义下稀疏矩阵为三对角块矩阵,有效减少了不同计算机节点间和同一计算机节点内GPU间的通信次数,提高了并行效率.在结点重排序时,选择一代表性坐标方向,将该坐标方向的结点坐标放大一适当倍数并取整数,采用计数法对此整数序列按大小进行快速排序.在同一计算机节点内的GPU间,采用Peer to Peer新技术直接进行通信.
其他文献
  罕遇地震作用下钢-混凝土混合结构的弹塑性动力时程响应分析和典型构件损伤演化程度的计算是建筑结构抗震性能设计的重要依据之一。本文拟从结构、构件单元、材料三个层
会议
  基于Hele-Shaw 理论及广义非牛顿流体本构方程,根据Folgar-Tucker 取向模型,建立了短纤维增强聚合物注射成型流动数学模型。采用Moldflow 软件对纤维增强聚合物在长方体模
会议
  扩展有限元法(X-FEM)以单位分解思想为基础,在传统有限元位移模式中加入阶跃函数和裂尖渐进位移函数来模拟裂纹问题。本文基于作者近期的研究进展并参考其他学者的一些工
会议
  本文建立了静脉壁的多层厚壁圆筒模型,应用多束纤维加强超弹性复合材料应变能函数,通过有限变形弹性理论研究了正常及病态下静脉壁在静脉跨壁压及轴向拉伸作用下的变形和应
  哈密顿系统是一种无能量耗散的保守系统,科学和工程中的大量问题都可归结为此类系统。辛算法是针对哈密顿系统发展起来的一种新型算法,它能很好地保持哈密顿系统的能量、动
  梁的高阶振动特性对MEMS 和NEMS 的设计十分重要。对于梁的高阶振动,特别是振动波长与梁的高度接近时,Timoshenko 梁理论不能给出精确的频率预测,并且其解的精确性严重依
  冲击波加速两种不同流体之间带有初始扰动的界面,由于斜压效应使得扰动界面开始发展,这种现象称为Richtmyer-Meshkov(RM)不稳定性,并会逐渐发展到湍流混合状态。本文利用大
会议
  经过近20年的探索和实践,中国工程物理研究院流体物理研究所冲击波物理与爆轰物理重点实验室主持了三级炮超高速发射技术的研究工作,武汉理工大学材料复合新技术国家重点
会议
  采用AIREBO 势对单层的理想石墨烯与含各种缺陷形状石墨烯的弛豫性能进行了分子动力学模拟,对模拟的石墨烯的表面形貌进行了分析对比,研究了石墨烯在弛豫过程中的动态平衡
  纤维增强合材料FRP(Fiber Reinforced Polymer)已经被广泛应用于混凝土及其它结构的加固.从上世纪90 年代初到现在,这项技术主要应用于结构抵抗静载、疲劳荷载和地震荷载