GPU球谐变换算法及其在分子模拟中的应用研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:c122319673
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图形处理器(Graphics Processing Unit,GPU)的快速发展,当前,GPU的理论计算能力和存储器带宽都大大超过了主流CPU。相对于计算机集群和超级计算机,将GPU作为CPU的协处理器完成大规模数据密集型的计算任务,具有更高的性价比。CUDA并行编程使程序员不需要掌握复杂的图形学API就能利用GPU并行计算;而MPI和CUDA混合编程从线程、进程两个粒度在多CPU、多GPU的计算环境下完成并行算法。球谐变换作为球体或者类球体对象的重要描述方法,在分子动力学、天文学、流体力学、热力学、计算机图形学等领域都有广泛的应用。球谐变换在描述复杂对象的时候,采用什么算法获得球谐变换的展开系数直接影响结算结果的准确性。本文的基于GPU的球谐变换快速展开算法,可以加速分子形状相似性的计算速度,具有重要的理论意义和现实意义。球谐变换快速展开算法涉及快速傅里叶变换和勒让德变换。离散傅里叶变换利用分治法思想和蝶形运算降低了时间复杂度和空间复杂度。一般的勒让德变换采用著名的三项递推公式求任意阶球谐系数,对于多离散点估值的球谐变换,效率不能令人满意。本文的通过线性变换的方法将原来的切比雪夫估值转换为同阶的多项式逼近形式,利用球谐函数采样点对称性降低计算量。本文的基于GPU的球谐变换快速展开算法及其在分子模拟中的应用研究,主要内容包括:1.研究了包括CUDA并行编程模型和CUDA+MPI并行编程模型的并行计算理论和技术和球谐变换快速展开算法的数学基础;2.利用CPU环境下的CUBS、FFTW库函数,实现球谐变换的串行展开算法;3.实现了CUDA环境下的球谐变换快速展开算法,CUDA并行算法在球谐变换展开系数L=1024的情况下和串行算法的加速比达到了9.72。实现了CUDA+MPI环境下的球谐变换快速展开算法,CUDA+MPI并行算法在球谐变换展开系数L=1024的情况下和串行算法的加速比达到了14.66,说明GPU在完成密集计算任务是有良好的表现;4.利用球谐函数作为分子空间结构的数据表示,通过GPU球谐变换展开算法加速计算出的球谐系数表示分子空间结构特征向量,可以缩短比较它们的相似度的时间。
其他文献
随着移动设备的广泛采用和移动计算需求的日益增长,各种移动技术不断涌现并得到应用,作为在网络层实现移动性的重点技术,移动IPv6使得移动节点能够在不同管理域之间无缝漫游,
下一代互联网协议IPv6彻底解决了IP地址资源危机,但在大规模的应用前,必需经过长时间的实验验证,从IPv4到IPv6的过渡必定是一个漫长的过程。在这期间,网络地址翻译NAT(Networ
随着网络技术的发展与成熟,分布式系统由于其相对于传统的集中式系统在性能、可靠性、可扩展性等各方面所表现出来的巨大优势,已在越来越多的领域得到了广泛的应用。由于分布
随着Internet的不断发展,WorldWideWeb已经成为人们获取信息的重要来源之一。然而Internet所固有的开放性、动态性与异构性,又使得用户很难准确快速地获取需要的信息。帮助用户
随着信息和通信技术的快速发展,计算模式经历了从最初把任务集中交付给大型处理机模式,到后来发展为基于网络的分布式任务处理模式,再到当今按需处理的云计算模式。云计算作为一
随着科技的进步与发展,企业级数据的传输,不同系统间的通讯,软件复用等需求在不断提升,中间件技术应运而生。近年来随着中间件技术的不断提高和推广,企业级分布式系统应用软件使用
图着色问题是一个被广泛研究的组合优化问题,也是科学计算和工程设计中一个重要和基本的问题。事实上,许多现实生活中的问题例如考试时间表问题和任务分配问题等都可以被模拟或
数据交换是影响企业信息化管理发展的主要因素之一。它的目标是在异构环境(松散耦合、数据格式不同、跨平台、跨地域的分布环境)中实现数据的共享,从而有效地利用资源,提高整个
研究能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应的控制搜索过程,从而得到最优解或近似最优解的通用搜索算法一直是令人瞩目的课题。遗传算法就是这种特别有效的
随着计算技术的发展,我们已经从网络计算时代进入了普适计算时代。在普适计算环境中,一方面是越来越多的新的设备、服务和计算实体出现在网络上,另一方面是人类的活动表现出