分子动力学模拟中近程非键结力计算的GPU加速

来源 :南开大学 | 被引量 : 0次 | 上传用户:ccsrg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分子模拟计算在当代化学、生物学及制药学等科学领域的研究中扮演着不可替代的作用。通过分子模拟计算可以大大缩短这些学科的研究周期,同时极大地提高其实验成功率。现今主流的分子模拟手段是分子动力学模拟法。尽管在模拟速度上取得了突破性的进展,但是分子动力学模拟计算也有着不可避免的瓶颈问题:原子间近程非键结力(Near Non-bonded Force,NNF)的计算耗时严重。实验表明,这部分计算占据模拟计算总时间的80%以上。加速近程非键结力计算对提高分子动力学模拟计算的整体速度,乃至进一步缩减相关学科的研究周期有着显而易见的价值。   本文分析了NNF计算相关理论和实现方法,提出采用GPGPU思想加速该计算。当代GPU高并行度、多线程的特征特别适合用来并行化NNF计算。本文选取性能卓越的开源分子动力学模拟软件Desmond作为实验对象,分析了使用GPU并行化其NNF计算的可行性,并采用当前在GPGPU方向取得突出成绩的CUDA技术实现了Desmond中NNF计算的GPU加速。本文为NNF计算的GPU加速设计了细粒度和粗粒度两种任务划分方案,分析了两者的利弊,并在更适用于GPU的粗粒度方案基础上为GPU上的NNF计算精心设计了完备的数据通信了存储方案,从而实现了NNF计算GPU并行化,将NNF计算的速度提高到原来的5倍左右。接着本文着手于GPU-NNF计算的性能优化,分别从实现算法和CUDA技术两个层面设计了诸多优化策略,主要包括算法上的计算依赖性优化及CUDA技术上的通信、访存及指令等优化。这些优化策略对提高GPU-NNF计算的速度都有着明显的作用,尤其是为计算依赖性优化设计的三种策略,将计算速度提高了近一倍。实验表明,通过GPU并行化NNF计算,可以得到10以上的加速比,将NNF计算的速度提高了一个量级,同时将Desmond整体的模拟速度提高原来的3~4倍,并且,GPU-NNF有着跟CPU上基本一致的正确性和稳定性。另外GPU-NNF计算的多卡并行性能和双精度浮点计算性能表现也同样优异。
其他文献
随着网络的日益发展,使用流媒体系统观看节目成为不可抵挡的趋势,它在逐渐抢占传统有线电视的媒体市场。基于P2P的流媒体系统在充分利用了网络中大量节点资源的条件下,确保了
随着数字音乐在网络中的不断发展,不仅使得广大的音乐爱好者可以通过计算机自动获取所喜爱的音乐,而且引起了计算机科学家及工程技术人员对自动音乐信息检索的极大研究兴趣。然
近年来,随着越来越多人群踩踏、恐怖袭击以及其他公共安全事件的发生,作为群体行为监控、分析、预警基础的人群异常事件检测已经成为智能监控领域中亟需解决的问题之一。然而
随着互联网技术的飞速发展,越来越多的数字内容开始在互联网上传播,数字内容服务已经成为互联网行业中发展最快、最有前景的领域之一。但是,数字内容通过网络传播时极易被非法获
随着云计算技术的推广,涌现了许多优秀的云计算平台,其聚合了大量硬件资源和软件资源,并采用虚拟化技术实现动态伸缩服务量,按需提供服务。为确保云平台正常运转,必须对整个云架构
随着信息技术和互联网的发展,基于流式数据的应用越来越多,传统的计算架构已经无法满足这类应用的需求。本文针对于基于数据采集和在线统计分析等Web应用的现实问题,设计并实现
随着信息科技的不断进步,智能手机设备正日渐普及,移动互联技术也在飞速发展,强大而丰富的手机应用功能为人们的日常生活、学习和工作带来了极大的便利。   在这之中,Android
P2P流媒体应用是目前网络应用研究中的热点之一,数据调度作为P2P流媒体系统设计中的一个关键性问题得到了广泛的关注。目前现有的相关P2P流媒体数据调度策略大多是在请求节点
随着现代网络存储技术的不断深入发展与广泛应用,网络集群服务与主机多路径技术成为信息系统容灾与安全解决方案中的两种重要核心技术。本研究课题将利用微软MPIO多路径框架
随着科学科技的发展,尤其是信息化进程的不断加快,计算机及互联网在人们日常生活中发挥的作用越来越大,普及率也越来越高。计算机在各方面给人们带来便利、高效率的同时,计算机及