IB-LBM圆柱绕流的CUDA加速实现

来源 :2010年全国高性能计算学术年会(HPC china2010) | 被引量 : 0次 | 上传用户:a5592306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用GPU的高峰值浮点计算性能和高存储器带宽,提出一种基于CUDA 架构的immersed boundary – lattice Boltzmann method (IB-LBM)的模拟算法.借助GPU 高度并行化,多线程特性,为每个网格分配一个线程,使多条线程并行 计算.在合理利用CUDA 存储层次架构中常量内存和纹理内存的同时,恰当使用共享存储器和寄存器规 避全局存储器的不接合访问及较长延迟.针对GPU 采用多种优化策略的同时遵循IB-LBM 模型的相应规 则实现模拟计算.实验结果表明,在NVIDIA GeForce 9800 GT 显卡和Intel.Core.2 CPU 6300 组成的 平台下,GPU 下实现速度提高到CPU的90 倍左右.
其他文献
本文基于雅砻江杨房沟水电站近坝旦波崩坡积体的综合勘察成果,运用宏观分析和稳定性计算等方法对崩坡积体进行了稳定性评价,分析了崩坡积体对工程的影响,并对崩坡积体处理方案进行了研究。
乌弄龙坝前堆积体成因主要为崩塌堆积,岩土物理力学试验成果及现场天然休止角测量成果对选取岩(土)体的力学参数具有较好的参考价值。通过采用刚体极限平衡法和有限元强度衰减数值法对堆积体稳定性计算分析,评价认为天然状态下,坝前堆积体稳定性好;水库蓄水后,堆积体前部(约70m高差)处于库水位以下,堆积体基本稳定;在蓄水和地震工况下稳定性降低,存在失稳的可能性,可能产生的破坏形式为前缘调整性坍岸再造。由于澜沧
通过在茨姑滑坡前沿取样试验测定滑带土的物理指标,采用仿真试验,在室内配制不同含水量试样进行剪切试验,建立含水率与土体抗剪强度曲线关系,获得不同含水量下的强度指标,再利用现场试验结果进行参数取值,进而进行滑坡稳定性计算及评价。此方法是在勘探、试验资料较少的情况下具有实用价值,值得同类工程借鉴。
面板堆石坝工程中容易出现混凝土面板脱空,查明面板脱空面积和高度是进一步优化设计和施工处理的关键。本文通过分析面板及脱空情况的基本特征,简述综合物探方法的选取原则、各方法主次位置确定、实施检测的程序步骤及资料解释方法,最后通过工程实例说明采用远红外热成像、探地雷达和声波映像法组合成的综合物探方法进行面板脱空检测具有较好的效果。
大规模时变科学数据可视化处理通常要按时间步分解输入,形成帧序列.每一帧的处理需至少经历数据载入、处理与绘制三个步骤.由于数据量大、读取模式不规则,数据载入成为制约帧处理性能的主要因素之一.考虑相邻帧物理图像的相似性,如果能够利用上一帧数据读入列表预测当前帧输入情况,那么可以在上一时间步数据输入之后将本时间步数据从外存读入内存,进而在本时间步处理过程中快速获得数据,减少可视化处理的等待时间.利用微机
随着高性能计算软硬件支撑环境日益复杂化,并行软件开发已成为大型科学工程计算(CSE)的主要瓶颈。本文介绍了高性能计算软件开发活动、以及该过程中的活动人员——高性能计算开发人员的特征;结合大量前人的实践和我们的经验,研究高性能计算软件开发中的瓶颈问题,并探讨了其中的一些技术途径。
BLAS 库是高性能计算中最基本的数学库,它的性能对超级计算机的性能有着极大的影响.而且随着CPU多核化的发展,BLAS的多核并行性能已经变得比与体系结构相关的单核性能更加重要.实验以流行于高性能计算的Xeon、Opteron 系列多核X86 处理器为例,全面测试了GotoBLAS、Atlas、MKL.ACML四种主流的BLAS 库的所有1,2,3 级函数,并覆盖了不同计算规模和多核并行方面的测试
随着图形处理单元(GPU)作为通用的计算单元,越来越多的客户采用基于GPU的集群来运行科学和工程应用。它允许用户使用一个异构计算模型,在程序的顺序部分在CPU 上运行而计算密集的部分在GPU 上运行。通过GPU 处理的大规模并行计算,相对于传统的基于CPU的计算模式,用户可以提高应用程序百分之四十的速度。本文档解释了,如何用PBS Professional(业界认可的高性能计算工作负载管理解决方案
降低设备虚拟化带来的性能损失是国内外虚拟化研究的热点之一。基于国产高性能微处理器,本文设计了一种新的“设备直接访问”虚拟化模型实现,并以网卡为例构建了原型系统。实测数据表明客户操作系统访问物理设备的性能与原始设备访问相比仅损失1-4%。该模型在高性能计算等领域具有优势。
网络中各种虚假或恶意欺骗的服务节点常导致用户很难快速获得高质量的组合服务,因此仅从性能角度研 究Web服务组合存在片面性。针对当前服务组合中信任机制被忽略的缺陷,提出了一种基于信任服务生成树的服务组 织方法,将服务提供者与服务请求的交互行为经演化后形成信任关系,使主体间可信程度达到相应级别,形成对外提 供相似服务功能的服务集合,将恶意、虚假的服务排除在信任生成树之外,使服务组合在可信场景中进行;在