基于CPU_GPU异构系统的LBM算法并行优化

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:zphym
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着高性能计算的发展,在超级计算机上进行数值模拟逐渐成为解决大规模科学与工程问题的重要手段之一。图形处理器GPU除了在处理图形计算上具有优势外,也逐渐被应用于密集数值计算上。同时,计算流体力学随着数值技术、并行技术和超级计算的发展,已经逐渐成为研究流体力学的支柱之一。格子玻尔兹曼方法是一种基于介观模拟尺度的计算流体力学方法,通过对大量离散粒子的统计分析从而得到宏观状态下流体的运动规律,已经广泛运用于能源、化工等领域的流体力学计算。但是由于其计算能力的限制,非常需要进行并行计算设计。基于GPU的并行研究已经在计算流体力学领域展现出了巨大的潜力。本文首先详细分析了LBM算法的公式演化过程,以及相关离散的数学模型,之后介绍了GPU的硬件架构,以及适配GPU的CUDA编程模型。在此基础上设计了LBM算法的并行优化策略。本文的主要工作内容如下:(1)LBM算法的热点分析。本文测试了三维方腔流动模型的计算热点,详细分析了热点计算过程与计算任务。测试结果表明,LBM算法的迭代过程有两个主要热点:碰撞计算与迁移计算。(2)LBM算法的GPU优化。结合GPU架构的特点,对碰撞和迁移两个主要计算部分分别进行了并行优化。在碰撞计算部分的优化中,通过地址映射以及共享内存分配的方法将计算任务分配到GPU的计算单元中。迁移计算部分由于存在数据依赖,无法直接并行。文中详细解析了迁移计算数据依赖的形成原因,之后通过模型降维、数据定位、区域划分的方法重排了数据读取的方式,成功消除了数据依赖造成的影响。经过测试,本文设计的算法具有良好的并行计算效率,在1.3亿网格下能达到1.92倍的加速比。通过改变网格大小,测试了不同计算规模下算法的性能,结果显示算法具有可扩展性,在不同的计算规模下都能获得较好的性能表现,具有良好的可伸缩性。(3)LBM算法的GPU优化在电对流模型中的应用。电动力学作为非接触驱动流体运动的一种形式,已经在计算流体力学研究领域引起广泛关注。方腔电对流作为经典的研究模型,对其并行设计研究能够为电动力学的计算提供案例。模型中需要解决的NS方程、NP方程、Poisson迭代方程均可使用LBM算法求解。本文对模型中三个核心计算方程分别设计并行算法,并测试了程序计算效率,在512~3网格时能达到1.52倍加速比。本文并行优化策略能够提升源程序在不同计算规模下的算法效率,表明算法能够应用在相关的流体计算模型中,对于其他LBM算法流体模型的并行计算具有研究意义。
其他文献
加强中华优秀传统文化教育,是推动文化传承创新的重要途径,也是培育和践行社会主义核心价值观,落实立德树人根本任务的重要基础。在民族地区中职学校的课程资源建设中,基于地方特色传统文化的校本教材建设对于推动中华优秀传统文化的传承,促进传统文化育人有着积极的意义。但是当前针对特色文化类校本教材的评价体系较少,构建民族地区中职学校特色文化校本教材评价指标体系有助于提升校本教材的质量,能够更好地弘扬中华优秀传
学位
随着工业互联网时代到来,联网设备越来越多,网络将会越来越拥塞。网络拥塞将会严重影响用户体验,在这种背景下网络优化越来越被人们需要,网络优化的第一步就是对网络QoS指标进行预测,预测功能作为网络优化的关键一步,为网络的优化提供数据支持。QoS是指网络服务质量,它的关键指标主要包括吞吐量、时延、网络抖动和丢包率等。某个QoS指标的值往往能够反映网络的实际状况,比如网络抖动和丢包率越大,网络也就越拥塞。
学位
教学质量是学校的生命线,教师教学质量评价是学校管理的重要组成部分,对教师教学工作起评判和导向作用。研究中职学校教师教学质量评价体系,对于实施科学的教师教学质量评价,调动教师教学工作积极性,促进中职学校强化教学管理,提高教学质量和教师专业发展水平,实现职业教育的可持续发展具有积极影响和深远意义。本课题以Q职业技术学校为研究案例,运用问卷调查法和访谈法等研究方法,总结该校实施教师教学质量评价取得的成效
学位
随着工业互联网技术的快速发展,越来越多的工业控制系统与互联网相连,使得ICS面临越来越多的网络安全威胁。如果ICS系统被入侵或遭受攻击,可能会导致生产线停机、设备损坏、数据丢失或泄露等严重后果,对工业生产和经济发展带来极大影响。因此,工业控制系统的安全问题必须得到很好的保证。入侵响应机制是保障ICS安全的重要组成部分,已经被视为ICS安全体系中的最后一道防线。只有在ICS入侵事件发生时采取快速、有
学位
随着中国人口的老龄化和预期平均寿命的延长,老年人的身心健康受到政府和社会各个领域的关注。在日常生活中,跌倒行为的发生是对老年人生命安全和身体健康最常见和最严重的威胁。检测、预防和实时干预跌倒的发生,可以显著降低老年人跌倒的风险,减轻跌倒对老年人产生的危害和对生活质量的影响。可穿戴装置以其便于携带、隐私性高、检测区域不受限等特点在跌倒检测中得到了广泛的应用,但由于老年人行走缓慢,手臂、臀部和腰部的运
学位
进入21世纪以来,从2001年“9·11”恐怖袭击到2008年“9·15”金融海啸,再到特朗普上台、英国“脱欧”、新冠肺炎疫情,我们频繁的“见证历史”。世界进入动荡变革期,西方学者提出的“无极世界”“零和世界”等一系列的概念都不足以概括世界巨变。“黑天鹅”“灰犀牛”等各种颠覆我们认知的事件层出不穷,外界对我国的压制和遏制随时可能升级。当代中国青年生逢其时,是社会的希望,民族的未来,祖国建设的主力军
学位
3D打印技术因可高效生产结构复杂的零件而被广泛应用于越来越多的领域。随着工业设计的不断发展,行业中对零件的性能、功能和应用都提出了更高的要求,多色多材料3D打印能够赋予模型多种属性,如颜色、强度和模量等,从而创造出更加复杂、具有多种性能属性的零件,进一步增强产品功能。但目前市面上的3D打印机以制造单色单材料零件为主,熔融沉积成型(FDM)3D打印技术由于成本低、操作简单而广受欢迎,因此开发一款消费
学位
近年来,随着互联网技术和大数据技术的广泛应用,工业互联网技术蓬勃兴起。工业互联网推动全球产业自我转型和重组,在产品、系统、工厂和地区等方面变得更加多样化。从工业经济的角度来看,工业互联网可以被视为一种新的生产力和竞争力的来源。它可以帮助企业实现数字化转型,从传统的生产制造向智能化制造转变,实现从单纯的产品供应商向智能化产品与服务供应商的转型。这种转型可以为企业提供更多的增值服务,帮助企业更好地了解
学位
随着自动化技术与电子技术的不断发展,自动导向车(Automated Guided Vehicle)逐渐被广泛应用于制造业、物流、仓储等领域,但是用于农业温室大棚的AGV还处于初期研究阶段。相比较室内、普通工厂等场景,农业温室大棚中温度高、湿度大且作业通道狭小,对AGV电机与电池的寿命、工作效率等影响更显著,因此,本文面向农业温室大棚专用的智能AGV,研发了一套基于STM32的实时采集、监测电机电池
学位
随着国家经济的快速发展,人们生活的物质需求也随之增加,对产品的需求也日趋个性化,导致企业生产小批量、定制化的产品越来越多。随之而来的是生产排程越来越复杂,由于缺乏有经验的专业排程人员和高级排程软件系统,导致生产效率低、交货时间慢等问题。高级计划与排程(APS)是以有限能力和可变生产提前期在众多的约束条件下迅速制定合理且具体的车间生产调度计划。但由于传统生产企业各个生产环节相互独立导致APS系统与实
学位