FMM算法中PP问题在GPU上的研究与实现

来源 :2010年全国高性能计算学术年会(HPC china2010) | 被引量 : 0次 | 上传用户:LIC3352
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  FMM算法是20 世纪最伟大的十大算法之一[2],由于是一种树形算法,要把其移植到GPU 上是一件极 富挑战性的工作。目前FMM的并行算法已有相当多的研究和实现,PetFMM [1]就是其中一种比较优秀的并行算 法实现。本文主要对PetFMM 中运行时间相对较大的PP 问题做出改进,使其能适合在GPU的SIMD 结构上运行。在整个FMM 程序中PP 问题在树层数较少时,是整个算法的瓶颈,但经过本文所述的方法优化后,能够明 显地减少PP 问题的计算时间,提高了整个程序的运行效率。本文利用GPU 进行加速后与同样的算法程序在CPU上运行比较,PP 问题最高可提高60多倍。
其他文献
  本文首先介绍多核处理器的发展,多核处理器分为同构多核处理器和异构多核处理器,并简要介绍 过去几种常见的异构多核处理器,如TI的OMAP多媒体处理器、Cell 处理器、特别
会议
在课堂教学中,让学生们进行将影片转换为剧本的练习,训练学生把剧本与镜头语言融会贯通,课后,要求学生自己写剧本,开始创作自己的第一个故事,这个过程也是独立学习的过程.微
语言教学是幼儿园教学的重要内容.如何采取符合幼儿成长规律的教学方法,有效促进幼儿园语言教学的质量,是目前幼儿园语言教学面临的一项重要课题.本文从游戏化教学方法在幼儿
  云计算平台是一个按需进行动态地部署、配置、重新配置、以及取消服务的平台,平台服务的高可用是云计算平台的重要指标之一.Java 技术被普遍采用,已成为构建云计 算平台的
【社区】拉丁词源:“社区”一词延伸自拉丁语“fellowship”一词,它一度被指为在人们松散的社会群体中可以预期的温暖和亲密关系。德国社会学家 F·藤尼斯《社区和社会》(18
在国家经济发展过程中,税务部门占据着重要地位,可以发挥出有效作用.在传统模式下,主要采用哲学理念进行管理,随着社会发展已经无法满足实际需求,因此要有效运用自然辩证法,
  近年来在生物计算,科学计算等领域成功地应用了GPU 加速计算并获得了较高加速比.然而在GPU 上 编程和调优过程非常繁琐,为此,研究人员提出了许多提高编程效率的编程模型和编
情感沟通的最佳方式就是语言表达,幼儿教育的关键时期,必须集中精力进行孩子们语言表达能力的强化培养,并且坚持以生为本、因材施教原则,鼓励幼儿朝着正确方向突破自我,将来
生命教育是一种更加关注个体成长与发展、注重个体生命价值的教育理念.幼儿阶段是每个人开始认知世界逐渐成长的初级阶段,也是生命教育的基础环节.绘本具有画面生动,颜色丰富
  运行状态的实时监控是对超级计算机进行高效管理的基础.目前的状态监控都是作为作业调度及资 源管理的一个子系统,仅从软件监控的角度提供诸如节点、网络、IO 等部件的负
会议