基于CPU+GPU异构计算平台的SAR成像研究与实现

来源 :中国航天第二研究院 航天科工集团第二研究院 | 被引量 : 0次 | 上传用户:ssfdlah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的主要目的是基于新兴的桌面CPU+GPU异构计算平台,进行SAR并行成像处理,以解决SAR成像中海量数据处理的速度和效率问题,此项研究的建立源自XX-SAR雷达地面快速成像处理的实际需求。具体研究内容和方法如下:  (1)在对平台的研究中,首先总结了多核CPU和GPGPU的并行编程方法;然后,针对OpenMP模型和CUDA架构,分别开展了多核和GPGPU并行程序设计方面的研究。在多核并行编程的研究中,归纳了使用OpenMP进行并行化时经常面临的循环并行化问题、数据竞争问题、Cache命中率问题、伪共享问题,并针对问题的解决提出了解决途径。在CUDA计算平台的研究中,介绍了Fermi图形与计算架构为GPGPU带来的新特性,结合工程实际,提出了fermi架构下CUDA程序的分级优化方法,简单实用,条理性强。  (2)在基于CUDA的SAR并行成像研究中,完成了对不含自聚焦的CS算法的并行化分解,并将各个组成模块在GPU平台上进行了实验验证,得到了相应的运行时间和加速比,最终计算出了CS算法在GPU上运行的总时间和加速比;GPU端运行总时间是731.82ms,CS算法的三类主要运算的时间总计为518.72ms,占CS算法成像总时间的70.90%;与基于CPU的运算速度相对较快的平台B相比,加速比为214.6倍。  (3)在基于CPU+GPU异构计算平台的SAR成像系统的优化中,将SAR成像中的I/O处理和GPU成像计算在任务级并行,提高了成像系统的吞吐量;并全面分析了系统硬盘顺序读写性能,通过组建RAID0磁盘阵列对硬盘I/O性能进行优化。硬盘I/O性能优化后,成像处理总时间约等于主控和GPU计算线程进行成像的时间,这说明硬盘I/O瓶颈已经解决,相比未进行任务并行处理和硬盘I/O优化的成像系统,加速比约为2.6,加速效果非常明显,CPU+GPU异构计算平台的计算能力在SAR成像中得到了充分发挥。
其他文献
数控技术是利用数字信息对机械运动和工艺过程进行高性能的自动控制,极大地提高产品加工质量、加工精度和工作效率。数控技术正朝着性能上高速度、高精度;结构上开放化、网络化
软件即服务(SaaS)是一种新型的软件应用模式,也是当前很多研究的热点问题。在该模式下,服务提供商负责提供必要的硬件基础设施和软件运行服务平台,租户使用简便的定制功能在服务
数据库管理系统作为一类主要的基础软件,由于它的安全特性、统一标准、高性能以及高可用性等优势,在信息技术所涉及的诸多领域都发挥着极其重要的作用。在很多应用中,对数据库的
作为人机交互技术的发展趋势之一,增强现实需要将虚拟信息无缝融合到真实场景中。近几年来,增强现实已经在医学,军事,娱乐等领域发掘出了很好的发展前景。随着智能手机的性能大幅
随着无线传感器网络的不断发展,与其相关的各项技术日益受到关注,其中自定位技术是各项技术的前提和基础,具有重要的研究意义和实用价值。但是,由于无线传感器网络自身的一些特点
近年来,随着我国航天军事事业的蓬勃发展,对于空间探索、航天器间交互及复杂战场中的通信任务提出了新的要求。与传统的基于TCP/IP的英特网应用环境不同,航天军事领域的网络面临
口令认证密钥交换(PAKE)协议使得参与通信的用户用一个低熵的口令就可以实现实体认证,并能通过不安全的信道安全地生成共享的高熵会话密钥。它们避免了一般认证协议要求存在公
三维集成电路通过硅通孔将多个相同或不同工艺的晶片上下堆叠并进行垂直集成。该技术可显著缩小芯片的外形尺寸,提高晶体管集成密度,提供更高的互连性能。然而,同时也带来了
随着IC工艺改进所带来的集成度提高,IC设计复杂度飞速提升,IC参数分析的复杂度也越来越大,由于供电电压直接影响电路的性能,所以电源线/地线网络分析(简称P/G分析)与热分析具
目前将GPS卫星定位导航系统与常规无线对讲机结合起来的系统,广泛的应用于防火监控、防汛指挥、车辆调度、紧急突发事件等。该向技术主要是利用GSM公众网的短信息或GPRS技术来