基于GPU的邻居搜索性能改进

来源 :第十二届全国计算(机)化学学术会议 | 被引量 : 0次 | 上传用户:ellen0807523254
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  基于GPU (Graphics Processing Unit)的分子动力学是近年来分子模拟方法的高性能计算的热点,其快速发展使分子模拟的计算方式正在发生变革,以往在机群上运行的批处理任务将可在带有GPU卡的桌面工作站上甚至是笔记本上运行,也有望将目前分子动力学模拟所能计算的时空尺度(ns、nm级)进一步扩展.本课题组已建立基于GPU的分子动力学模拟程序GMD,经测试发现非键力计算占总的计算量的80%左右,非键力计算过程中的邻居搜索步骤占总的计算量的73%左右,且邻居搜索的加速比较低,显然原GMD的邻居搜索算法成为制约GMD整体性能的瓶颈.本文通过以GPU的指令执行单位warp为单位组织、处理线程,并对粒子排序以保证对全局存储器的合并访问,且充分利用各类存储器,提高了GPU卡的有效访存带宽和计算效率,大幅提升了邻居搜索的计算性能.本文分别对含4.5万个粒子和36万个粒子的聚乙烯(Polyethylene,PE)体系进行了性能测试,结果表明,邻居搜索性能较原来的GMD提高了5倍,是GROMACS 4.6.3(2013年的最新版本)单核CPU的27.5和28.17倍、是其八核CPU的5和4.17倍,详见图1.
其他文献
会议
会议
会议
Fat mass and obesity associated gene (fto) is significantly related to obesity, which was found in human patients and confirmed in rodent studies.FTO protein is a nucleic acid demethylase, targeting m