雅可比迭代的CPU/GPU并行计算及在CFD中的应用

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:jackmengxiaojing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本研究从CFD 实际应用背景出发,综合多核与众核的特点,采用OpenMP 线程嵌套以实现CPU/GPU 的协同并行计算,实现了雅可比迭代法的GPU 加速以及OpenMP/CUDA 混合并行算法,并将其用于结构网格气动外流场的数值模拟.对单区200万结构网格数据,右端项、左端项矩阵及矩阵求逆、雅可比迭代等核心计算部分的GPU 并行分别取得了11.35、13.83 和8.34 倍的加速比,整个求解过程取得了9.86 倍的加速比;对200万4区结构网格数据,整个求解过程的GPU 并行加速比为5.56,CPU/GPU 协同并行的加速比为7.49.
其他文献
  本文在JASMIN框架中设计实现了多块协调拼接网格并行支撑软件模块。该模块针对多块协调拼接网格并行计算中的通信性能瓶颈问题,设计实现了网格块间关系统一描述算法,及网格
  当前在高性能计算机平台上,大规模、大尺度、长时程数值计算由于浮点计算的舍入误差累积效应,常导致不可信的数值结果。于此同时,多项式函数广泛应用于大规模工程科学计算的
会议
  为了解决复杂的Petri网并行化及模拟执行问题,提出将颜色等高级Petri网转化成库所/变迁网(Place/Transition Net)的并行化预处理方法,以便能够对P/T网实现并行化。根据颜色
  分布式文件系统伴随着云计算的发展逐渐受到重视.parallel-NFS做为主流的分布式文件系统,吸引了大量国内外研究人员的兴趣.本文描述了parallel-NFS的系统框架和工作原理,提
公司是国家发改委,环保总局等6部委确定的首批循环经济试点企业。随着公司的产能及资源整合的不断扩张,公司业绩将迎来新一轮爆发性增长。 The company is the National Dev
  随着多核/众核成为处理器结构发展的主流,如何充分有效的利用大量的核资源越来越成为程序性能提升的瓶颈问题。为了减少资源的竞争,针对多核/众核处理器系统的核资源优化使
会议
  任务调度问题是一个NP完全问题,基于启发式的方法通常被用来求解次优解,其性能在很大程度上依赖启发的成效,在复杂问题时可能会产生不理想的结果.鉴此,根据DNA 双螺旋结
会议
  随着获取设备的发展,大尺度、高分辨率数字图像已逐步步入现代人们的生活,大尺度图像的梯度域编辑显得更为重要。求解大规模未知数的泊松方程是大尺度图像梯度域编辑的关键
会议
被称为“中投二号”的国新资产管理公司的准备工作已经基本完成,近期将要公开亮相;国资委将以此为契机,加快中央企业重组和调整步伐,今年要把中央企业调整到100家以内。 The
  环境数据采集是无人机飞行控制和地面实时监测的一部分。本文提出了一种基于抽样时间间隔自适应调整的动态环境数据采样方法,该方法主要应用于X5 无人驾驶飞机中。本文的