基于CUDA的RTM算法并行优化

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:longxue1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  RTM(Reverse Time Migration)逆时偏移算法是地震勘探领域复杂构造油气藏成像的精确算法之一。本文在分析RTM算法及NVidia GPU并行体系结构基础上。针对算法并行性。采用窗口推进遍历网格的方式实现了基于CUDA的RTM算法并行。并从算法设计、纹理访存、指令流等方面进行优化。实验结果显示。与CPU代码实现相比,GPU并行算法在保证精度的基础上相比单核CPU算法获得了超过120倍的加速比,从计算精度和计算时间上说明RTM算法适合在GPU上并行。
其他文献
  提出一种面向大规模同时多线程处理器可扩展高速缓存的动态划分方法.将文献所提的机制扩展到多体高速缓存中.线程的内存访问特征变化迅速,因此在运行时收集同时多线程的缺
  目前GPU已经成为提高算法性能的一个重要途径,OpenCL 是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU 或其他类型的多核/众核处理器组成.本文主要介绍基于OpenC
  身份认证技术作为信息安全门户之一,对于提高网络通信安全性具有重要意义。传统身份认证技术在通信过程中会直接或间接地传输用户相关的机密信息,由于认证系统本身存在漏洞
  可扩展性和短直径是设计大规模并行计算机系统互连网络的两个重要因素。基于Octagon 拓扑结构的短直径和Torus 拓扑结构的可扩展性,提出了一种新的互连网络拓扑结构,称为Oc
  尽管高性能计算机性能提升越来越快,但由于其体系结构的复杂性和微处理器的复杂性,并行应用程序普遍存在性能问题,许多实际应用的持续性能通常只能达到机器峰值性能的5~10%,因
会议
  面向大规模工程计算,JASMIN 框架在并行使能技术和数值算法上进行了发展和完善.2.0 版JASMIN 框架保持编程接口兼容,无需用户修改程序,可直接提升已有程序的并行可扩展能
会议
  连续的数据无关是指计算目标矩阵连续的元素时使用的源矩阵元素之间没有关系且也为连续的,访存密集型是指函数的计算量较小,但是有大量的数据传输操作.本文在OpenCL框架下,
会议
  针对传统的并行Delaunay 网格生成方法在将子域映射到处理器上时没有考虑子域间的邻接关系,单个处理器上生成得到的子网格通常由多个不相邻的子域网格构成以及子网格之间
会议
  提出一种基于云模型和支持向量机(Support Vector Machine,SVM)的入侵检测特征选择方法,该方法采用逆向云发生器从真实训练数据中得到云的数字特征,形成实际判断规则,实
  Oracle HotSpot 是最重要的开源虚拟机之一,服务器版(C2)即时编译器是HotSpot 针对服务器高效运行的重要组成部分。本文在分析HotSpot C2 即时编译器结构的基础上,针对某国