论文部分内容阅读
本文的主要目的是基于新兴的桌面CPU+GPU异构计算平台,进行SAR并行成像处理,以解决SAR成像中海量数据处理的速度和效率问题,此项研究的建立源自XX-SAR雷达地面快速成像处理的实际需求。具体研究内容和方法如下: (1)在对平台的研究中,首先总结了多核CPU和GPGPU的并行编程方法;然后,针对OpenMP模型和CUDA架构,分别开展了多核和GPGPU并行程序设计方面的研究。在多核并行编程的研究中,归纳了使用OpenMP进行并行化时经常面临的循环并行化问题、数据竞争问题、Cache命中率问题、伪共享问题,并针对问题的解决提出了解决途径。在CUDA计算平台的研究中,介绍了Fermi图形与计算架构为GPGPU带来的新特性,结合工程实际,提出了fermi架构下CUDA程序的分级优化方法,简单实用,条理性强。 (2)在基于CUDA的SAR并行成像研究中,完成了对不含自聚焦的CS算法的并行化分解,并将各个组成模块在GPU平台上进行了实验验证,得到了相应的运行时间和加速比,最终计算出了CS算法在GPU上运行的总时间和加速比;GPU端运行总时间是731.82ms,CS算法的三类主要运算的时间总计为518.72ms,占CS算法成像总时间的70.90%;与基于CPU的运算速度相对较快的平台B相比,加速比为214.6倍。 (3)在基于CPU+GPU异构计算平台的SAR成像系统的优化中,将SAR成像中的I/O处理和GPU成像计算在任务级并行,提高了成像系统的吞吐量;并全面分析了系统硬盘顺序读写性能,通过组建RAID0磁盘阵列对硬盘I/O性能进行优化。硬盘I/O性能优化后,成像处理总时间约等于主控和GPU计算线程进行成像的时间,这说明硬盘I/O瓶颈已经解决,相比未进行任务并行处理和硬盘I/O优化的成像系统,加速比约为2.6,加速效果非常明显,CPU+GPU异构计算平台的计算能力在SAR成像中得到了充分发挥。