基于GPU的颗粒离散元计算方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:xrong19730911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离散元方法(Discrete Element Method)是将计算的对象离散成大量相互独立的单元,并定义单元间相互作用的方法。通过离散元的方法可以解决很多现实中的问题,如模拟泥石流、滑坡等地质灾害,对于传统的计算机系统,在解决DEM问题上存在着局限性。尤其是在大规模DEM计算上,近些年发展缓慢。本文是基于GPU实现大规模DEM的并行计算。目前,并行计算是提高算法性能的主要方式,无论是大规模集群系统还是个人电脑,甚至是智能手机,都将性能的提升寄托于并行计算。曾主要用于计算机可视化和图形图像处理的GPU芯片,内部具有大量的并行计算单元,有着天然的并行优势。并行计算在大规模离散元计算方面有着重要的意义。本文的并行计算过程中是基于大规模的颗粒离散元基于GPU平台,通过CUDA编程工具,完成了包括颗粒与三角形边界面碰撞检测和数据更新的并行判断,整个系统的实现是由CPU和GPU来实现的,对于计算前的数据准备和数据的输出都是有CPU来完成的,其中主要的接触判断和力学计算是由GPU来完成。颗粒数量可达到百万级别的,通过与串行系统的比较,计算出加速比,通过颗粒系统的动态显示系统软件对系统计算的结果进行了显示。本文通过多种方法进行对并行计算系统进行了优化,通过使用NVIDIA Profiler对并行计算的三个主要的内核函数进行系统的分析,针对不同结构的函数使用不同的优化方式,在颗粒与颗粒的接触判断核函数中,邻居的搜索是关键,通过对网格法的计算,确定出最优的并行模式下网格划分,优化后的数据结构适用于数据的合并访存,并且对共享存储模式下的访问冲突做出了优化。在力学算法上的优化,减少内部分支,并分别对优化前和优化后的结果进行性能上的分析,在优化比上显示出优化后的整个程序计算性能的稳定性和随着数目的增多优势越明显的特性,进一步证明GPU离散元计算的有效性、稳定性、高效性。
其他文献
移动Ad Hoc网络是一种由多个不依靠基础设备而独立运行的无线终端组成的多跳分布式自治网络。近年来,随着通信技术的不断发展和硬件设备性能的不断完善,Ad Hoc网络逐渐引起广
大量的具有无线通信功能的各种传感器节点组成了新一代的无线传感器网络,这些节点采用多跳方式通信,并且可以构成自组织无线网络。在社会生活、环境监测、航空航天、军事国防等
目前世界上最新的文语转换系统(Text-to-Speech)虽然能够合成可以很容易理解的话语,但是缺乏自然语言中所蕴含的韵律特征。这是由于单句录音构建的语音语料库所训练出来的模型在
互联网的快速发展对大规模数据处理技术提出了新的挑战,目前业界广泛使用的数据处理系统多数基于Google提出的MapReduce并行处理框架,MapReduce在处理静态批量数据时优势明显,然
我们生活在一个信息时代,每天接触的信息不计其数。而图像作为信息载体之一,是人们获取信息的有效途径。科学研究表明,人类接受的外界信息有3/4是通过视觉器官来得到的。与声音
社会化标注是用户产生的用于描述网络资源的关键词,区别于传统的自上而下的信息传播方式,社会化标注来源于广大的互联网用户,作为一种新兴的重要的信息资源,能够与广大的互联
中国的高速铁路这些年快速发展,其对公众生活影响愈发广泛。高速铁路的安全运行关系到旅客的健康和生命,显得尤为重要。高铁接触网作为向电力机车供电的设备,其上有可能附着
随着Web2.0的快速发展,网站对于Ajax技术的应用越来越多。Ajax技术通过异步调用,进行页面局部刷新,在很大程度上提高了用户的体验度、减少了网络传输流量以及提高了网站的访问速
本文研究了基于视频图像实时传输和光谱数据采集的作物病虫害采集终端,以及远程控制终端搭载的农药喷洒设备进行动作的技术。首先,针对当前作物病虫害防治领域存在的问题和不
近年来,随着互联网、数据存储以及计算技术的飞速发展,使得信息的收集与分析变得越来越便捷、完整与精确。然而,这些以信息共享、数据挖掘与知识发现等为目的的数据发布过程