论文部分内容阅读
稀疏表示实现了信号和图像信息的一个更加简洁的表达,并揭示了其内在稀疏性,目前在各个领域都有着广泛的应用,尤其伴随空间技术的突飞猛进,在空间应用的星载图像处理领域。其实质就是通过稀疏变换得到图像的稀疏形式,以便图像更好地处理。然而,由于星载图像数据巨大,稀疏变换的计算复杂度高,不得不面临提高其实时处理能力的问题,而针对空间应用的硬件平台加速是未来实时性应用发展的要求。因此,研究图像稀疏变换低复杂度的硬件实现是一个非常具有使用价值且深远的研究课题。为了提高面向空间应用的星载图像稀疏变换的实时性能,本文从硬件设计角度出发,分别对奇异值分解和双正交重叠变换展开了深入研究,面向现场可编程门阵列(Field Programmable Gate Array,FPGA),利用器件结构特点以及开发的优化设计技术,提出了稀疏变换的低复杂度结构,特别其低时间复杂度的结构实现。 本研究主要内容包括:⑴针对脉动阵列顶层结构,提出了一种快速小矩阵奇异值分解结构。该结构设计考虑将奇异向量矩阵计算引入顶层结构,消除了每次迭代处理单元的闲置时间,大大提高了算法的计算效率,从而加快了整个算法计算速度;然后,针对脉动阵列的底层结构,提出了一种快速的小矩阵特征值分解实现结构。该结构在计算底层结构的旋转变换时,利用了类坐标旋转数字计算(Coordinate Rotation Digital Computer-like,CORDIC-like)算法,同时底层处理单元通过传递符号集通信,替代了传统的旋转角度通信,即简化的CORIDIC-like算法。该设计结构使得特征值分解算法计算时间减半。⑵针对大矩阵奇异值分解,利用小矩阵奇异值分解快速实现结构,提出一种基于Block-Jacobi奇异值分解算法的快速实现结构。由于硬件平台资源的限制,大矩阵需存储于外部存储器中,因而,为了减少了访问外部存储器的遍历次数,采用收敛速度更快的Block-Jacobi算法计算奇异值分解,因此,其实现结构的时间复杂度得到了显著降低。⑶针对图像编码标准JPEG XR的核心变换双正交重叠变换,提出了一种统一的前向核心变换算法,并映射得到了高效的蝶形硬件结构,统一结构使得前向核心变换实现在资源消耗和关键路径都显著降低,同时衍生的混合并行结构提高了变换的计算速度。该算法通过调整前向核心变换三个基本操作系数,得到它们的运算相似性,进而可以统一实现。为了改善统一结构实现计算复杂度,对统一系数矩阵进行优化,使得在硬件实现中相关运算可以复用,同时也减少了关键路径延时。⑷针对双正交重叠变换结构对于不同输入带宽的需求,首先提出了一种高效的二输入二输出结构,然后设计了四输入和八输入带宽的快速实现结构。利用前向核心变换统一算法实现思想,对双正交重叠变换每个提升结构变换分别进行调整,采用相关运算复用以及数据流修正技术,得到了硬件复杂度更小的二输入二输出结构;而四输入结构在实现前向核心变换时采用混合并行结构即可,资源消耗和计算时间都有所降低;八输入结构可通过增加四输入提升结构模块个数来适应高吞吐量。