论文部分内容阅读
太赫兹(THz)波是指位于毫米波和红外之间,频谱范围为0.1~10THz的电磁波。与毫米波相比,太赫兹波波长较短,具有更高的空间分辨率和精度;相比于X射线,太赫兹波的非电离性意味着其光子没有足够的能量将人体组织的分子和原子电离出来,从而避免了有害化学反应发生;相比于可见光和红外,太赫兹波会刺激物质的分子运动和电子运动,照射不同材料的物质,太赫兹波会被反射、透射或者吸收,该特性可以用来识别爆炸物、探测隐藏武器、检查航天飞机表面缺陷、筛查皮肤癌和龋齿以及安检扫描等。当前典型的太赫兹近场成像体制包括“单收单发(Single-Input-Single-Output,SISO)-扫描”、“2D(二维)-多收多发(Multiple-Input-Multiple–Output,MIMO)”、“MIMO-扫描”等。“SISO-扫描”体制系统复杂,成像速度慢,“2D-MIMO”体制系统虽然成像速度快,但相较于“SISO-扫描”体制,系统复杂度更高。相较于SISO阵列,MIMO阵列具有阵元利用率高、系统成本低等特点。因此,“MIMO-扫描”成像体制兼顾了高成像速率和较低的成像系统复杂度,基于该体制的成像算法是太赫兹近场成像领域的重要研究方向。GPU(Graphics Processing Unit),即图形处理器,它强大的并行计算能力已使得其由起初的电脑显示处理器演变为通用处理器(Genneral Purpose Unit),在视频处理、智能遥感、航天探测等领域应用广泛。基于以上研究背景,本文主要研究基于GPU的MIMO阵列成像算法实现,研究工作和取得的进展概括如下:1、将BP成像算法推广到MIMO线阵成像系统。BP算法是典型的时域成像算法,成像精度高且对阵列布阵方式没有要求。建立了MIMO线阵时域回波模型,并推导了BP成像算法,最后通过对场景中5个散射点的仿真验证了BP算法良好的聚焦性能。2、在太赫兹安检成像中,远场平面波假设不再成立,同时由于阵列尺寸、扫描长度以及观测孔径与检测目标之间的距离三者之间尺寸相当,导致了该体制下等效相位中心近似法不再适用。针对这些问题,本文选用了一种基于球面波模型的快速全聚焦成像算法。相对于时域BP算法逐点扫描所带来的低效性,本文研究的快速全聚焦算法在保证了高精度的同时提高了算法的效率。进一步针对在该算法在推导过程中忽略了球面波高阶散射分量和传播衰减的问题,通过推导频域改进的基尔霍夫表达式对该算法进行了修正,仿真结果证明了修正后的算法有良好聚焦效果。3、设计了基于GPU的MIMO阵列并行优化框架。针对数据量大以及扫描速度慢等导致了成像速度慢,不能满足太赫兹安检成像实时性要求这一问题,设计了基于GPU的并行优化框架。根据选定的成像算法技术路线,对一些数据密集型和计算密集型的操作设计出基于CPU和GPU协作处理的并行处理方案,并根据计算量和数据结构选定适合的计算平台。本文选定了包含8块GPU和2块CPU的计算平台,GPU与CPU相互协作完成算法优化的实现。通过GPU优化算法实现结果与Matlab仿真结果的一致性证明了并行框架设计的正确性。4、研究了嵌套循环并行化处理及多GPU并行实现算法。成像过程中遍历各维度采集信息,数据结构方面涉及多种转换以及大量累积操作等步骤,串行处理将会造成巨大的时间消耗。基于以上问题,分析了数据结构与算法逻辑关系,将串行执行优化为相互独立的多分支并行执行;设计OpenMP结合多GPU技术并行实现框架,使用8块GPU并行执行任务,使得算法实现效率提高了2个数量级。5、针对数据量大导致的显存溢出情况,本文提出了多流异构执行、数据分块等解决方法,多流异构处理在解决了显存溢出的同时还减少了I/O传输时延。针对按列FFT变换访存数据慢的问题,提出的数据变换方法满足了合并访存要求,提升了运算效率。通过对上述算法的优化实现,成功实现了用8块GPU(K40c)在8秒钟完成Matlab2017(处理器:Intel(R)Core(TM)i7-4790 CPU@3.6GHz安装内存:4GB)需10个小时的工作量。