基于GPU的并行非连续变形分析方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wonghost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非连续变形分析已被广泛应用于岩体稳定性分析、隧道修建、边坡开挖、爆破等多种工程领域。该方法严格遵守数学与力学原理,可模拟块体运动的大位移与大变形,是一种针对岩石非连续介质受力运动分析的重要数值方法。但非连续变形分析方法面对大型工程问题时,计算效率较低。本文针对非连续变形分析计算效率提升的客观需求,基于具有强大并行运算能力的图形处理器(Graphic Processing Unit,GPU),研究非连续变形分析的并行方法,解决非连续变形分析的效率瓶颈。  本文的主要研究内容包括非连续变形分析并行接触检测方法、并行稀疏线性方程组求解方法及并行数据依赖性与线程分支解决方法。主要创新性工作如下:  1.提出了基于矩阵模型与数据分类的并行接触检测算法  针对接触检测计算的不同阶段,本文基于矩阵模型与数据分类提出了高效的并行接触检测算法。在接触粗检测阶段,建立了矩阵与向量接触模型,对接触矩阵进行重构与子矩阵划分,提出了一种预处理代价低、线程负载平衡及数据复用性高的并行粗检测方法;在接触细检测阶段,提出了对被接触顶点重聚集与分块的距离检测方法,解决了并行负载不平衡与数据复用性低的问题,同时提出了接触对数据预分类方法,基于接触顶点距离与角度关系进行预分类,改善了并行线程分支问题;在接触转移阶段,利用并行分块查找算法实现了接触转移。实际测试表明本文提出的并行接触检测算法在非连续变形分析中可获得百倍的加速比。  2.提出了基于带预处理共轭梯度法的稀疏线性方程组并行求解方法  结合非连续变形分析方程组求解的迭代机制,本文提出了迭代过程中主机端与设备端数据通信的优化方法,优化前每一次迭代均需回传一个双精度浮点数,优化后只需在预估的数十次或者百次迭代后回传一个整形数据。结合非连续变形分析的计算机制与总体刚度矩阵特性,提出了针对非连续变形分析的共轭梯度法预处理因子选择方法,从理论分析与实际测试两个角度论证了方法的正确性。结合刚度矩阵天然对称分块的特性,提出了两种并行稀疏矩阵向量乘方法,一种方法基于刚度子矩阵分割,解决了子矩阵规模与GPU线程束大小不匹配的问题;另一种方法充分利用了总体刚度矩阵对称的特性,上三角子矩阵被读取后作为上三角部分与下三角的转置进行两次计算,由此将刚度矩阵数据的存储与读取量降低了一半。两种方法的计算效率均优于CUDA稀疏矩阵算法库(cuSPARSE)提供的分块稀疏矩阵向量乘算法,前者可达1.48~1.77倍,后者可达2.65~3.27倍。实际测试表明本文提出的非连续变形分析方程组并行求解方法最高可获得65.73倍的加速比。  3.提出了基于并行扫描与基数排序的数据依赖性与线程分支解决方法  本文将非连续变形分析中存在的数据依赖性归结为数据聚合、多维数组索引计算及数据写冲突三点,并提出了基于并行扫描与基数排序的解决方法。采用shuffle指令进行优化计算中的归约操作,分别获得了1.6倍与1.8倍的加速比。针对线程分支问题,在粗粒度的层面上,采用数据预分类的方法,对计算前分支标示已定的数据进行分类,避免这些可预见的线程分支。在细粒度的层面上,采用线程分支计算转换与分支重构的方法,将简单的分支通过异或运算转换为计算,为复杂的分支引入额外的控制元素,合并各分支的计算指令,将线程分支限制于寄存器的写操作。粗粒度与细粒度层面优化方法的结合使用可有效改善非连续变形分析存在的线程分支问题。  4.完成了面向实际工程算例的并行非连续变形分析数值实验与验证  本文实现了完全基于GPU并行的二维非连续变形分析与基于GPU并行粗检测的三维非连续变形分析,并利用解析解算例验证了并行算法的正确性,同时利用三个实际工程大规模算例测试了并行实现的计算结果与效率:其中基于GPU并行的二维非连续变形分析在边坡稳定性与动态落石分析算例中分别获得了56.63与8.4倍的加速比;三维非连续变形分析的并行粗检测在金字塔算例中获得了千倍的加速比。  本文面向非连续变形分析在工程应用中的效率需求,从接触检测、稀疏线性方程组求解及数据依赖性与线程分支处理三个方面,为非连续变形分析的GPU并行提供了全面的算法支持与解决方案,有效提升了非连续变形分析的计算效率,满足了实际应用的需求,可促进非连续变形分析方法的进一步发展与应用。
其他文献
本文首先提出了一种新的网络应用:无线终端通过AP接入校园网,从而实现校园网中无线终端之间的语音通信,校园网的宽带为这一应用提供了必要条件。接着,本文从基于H.323协议的VoIP
随着信息化的深入,大数据在各个领域产生了巨大的价值,海量数据的存储和快速分析成为新的挑战。传统的关系型数据库由于其性能、扩展性的不足以及价格昂贵等方面的缺点难以满足
该文论述了面向对象的炉型管理系统的设计和实现.针对炉前操作人员对炉型管理的新需求,提出了采用基于十字测温边缘温度、炉墙温度和理论燃烧温度计算炉墙粘结厚度的理论和方
空间光照条件使得天基图像对比度远高于地面图像,这就导致了图像中空间目标的细节信息流失。为了解决这一问题,本文以Sandroid卫星平台为基础,研究设计了一套能在轨实时运行的高
本文首先介绍了网络拓扑发现的背景和意义。指出网络拓扑发现可以分为逻辑拓扑和物理拓扑两种情况。然后详细介绍了逻辑拓扑发现的研究现状,分析比较了常用的几种算法。其次介
公交车体广告是一种高频率的流动广告,其覆盖范围广,信息传递效果好,近十年在城市中高速发展,成为越来越受企业欢迎的品牌推广形式。然而,如何快速生成公交车体广告投放方案(即线路
从第一台计算机冯·诺依曼机诞生至今的半个多世纪以来,计算机科学与技术对现代科技产生了深远影响并已渗透到人类生活的方方面面。在多媒体领域中,如何有效地处理、存储、显示
随着网络的开放性、共享性和互连程度的不断扩大,特别是Internet的出现,网络的重要性对社会的影响也越来越大。网络上各种新业务的兴起,如电子商务、电子政务、网上银行等,使
问题报告和代码提交之间的关联在软件验证和维护方面起着重要的作用。然而,在实际软件项目中,关联信息并不总能在软件的开发或维护的过程中被明确提供。目前,最常见的做法是依赖
伴随着信息化进程的推进及电子政务系统在中国的实施,办公自动化系统OA(Office Automation)已经被国家行政机关、高校、科研院所广泛采用.该论文结合课题"辽宁工学院办公自动