论文部分内容阅读
随着多媒体技术不断发展,不同设备和传输环境中对于计算能力、带宽和存储器等方面要求的差异日渐突出,传统的静态图像标准难以提供更多功能和更高性能以满足不同应用环境的需求。在这种情况下,新的静态图像标准JPEG2000应运而生,为这些新需求提供了以往标准未能很好实现的特性以及技术支持,具有质量渐进性和分辨率渐进性的特性,能够在统一的框架内满足不同应用环境的需求。离散小波变换变换作为JPEG2000静态图像标准中的核心算法,在时域和频域同时具有良好的局部化性质,保证了JPEG2000一系列重要特性的实现。但随之而来的算法复杂度和数据存储要求给离散小波变换的实时处理提出了严峻挑战,成为当前的重要研究热点。本课题主要通过研究离散小波变换基本理论及其在JPEG2000静态图像标准中的应用,进行离散小波变换关键技术的研究,主要包括离散小波变换硬件架构及其定点实现精度分析的研究。
本文研究了离散小波变换硬件架构,改进并提出了多种离散小波变换的硬件架构。本文通过改进递归金字塔算法,给出了一种基于提升递归算法的多级递归一维离散小波变换硬件架构。该架构以递归方式交错完成基于提升的多级离散小波变换,减少了多级一维离散小波变换的计算时间,提高了硬件利用率,减少了存储开销。本文通过分析提升算法的数据通路,给出了一种改进的低复杂度的二维离散小波变换硬件架构。该架构通过采用折叠技术,将乘法器和加法器的数量减少了一半,具有复杂度低、关键路径短、数据流规则的特点。本文通过改进提升算法的数据通路,给出了一种存储器高效的二维离散小波变换硬件架构。由于存储器的设计与实现决定了整个二维离散小波变换架构的硬件开销和控制复杂度,该架构通过去除水平方向和垂直方向的一维离散小波变换间所需的转置模块,减少了片内存储器开销和计算资源开销,缩短了输出延时。在实现二维离散小波变换时,已有的提升算法导致水平方向和垂直方向的一维离散小波行变换和列变换中数据扫描顺序不一致,增加了存储器开销和控制复杂度,限制了系统吞吐率和运算速度的提高。为了解决该问题,本文提出了一种分解提升算法(Decomposed Lifting Algorithm,DLA),能够随着每个输入数据执行提升步骤的部分运算,从而以一致的数据扫描顺序执行水平方向和垂直方向的一维离散小波变换,和已有的提升算法相比,更适合二维离散小波变换的硬件实现。本文基于DLA算法提出了一种高性能的二维离散小波变换架构。该架构大幅减少了片内存储器的硬件开销,避免了多级运算过程中的片外数据访问,降低了系统功耗,缩短了输出延时,降低了控制复杂度,还可通过扩展处理单元的方式实现并行计算,成倍提高系统吞吐率和运算速度。该架构可在M×N/4个时钟周期完成一帧M×N图像的二维离散小波变换,运算速度比已有架构提高了2~4倍;实现5/3小波和9/7小波时分别只需2N和4N大小的片内缓存,分别比已有架构至少减少了42.9%和27.2%;实现多级二维离散小波变换时,只需4(J-1)个寄存器(J为分解级数)存储各级子带系数和8N(1-2-J)的片内存储器存储各级中间结果,并实现了100%的硬件利用率,而已有架构存储子带系数时或者采用MN/4的片外存储器,或者采用KN(1-2-J)(K=10~30)的片内存储器,前者增加了片外数据访问时间和系统功耗,后者增加了片内存储器的硬件开销。
本文研究了离散小波变换硬件定点实现中的有限字长效应,分析了量化误差与重建图像质量的关系,系统分析了离散小波变换定点表示方式对计算精度的影响,并对定点表示方法进行优化设计,从而在字长相等的情况下提高重建图像质量。本文首先分析离散小波变换中定点表示产生的有限字长效应,再对由此产生的多级二维离散小波正变换和反变换中的量化误差建模,最终获得量化误差与重建图像质量的关系。本文基于提升步骤的一般运算建立误差模型,分别考虑了中间结果数据和乘法器系数的定点实现对重建图像质量的影响,适用于基于不同提升算法的离散小波变换。为了在定点表示字长相等的情况下提高散重建图像的质量,本文提出了一种提升步骤多级动态伸缩的定点实现优化设计技术,通过在离散小波变换中各级提升步骤运算的基础上进行额外的伸缩运算,限制中间结果数据所需的溢出保护位,从而在定点表示字长相等的情况下,保留更多的数据位用于表示小数部分数据,减小有限字长效应导致的量化误差,提高重建图像的质量。本文采用该技术对DLA算法实现的离散小波变换定点实现方法进行优化设计,并通过精度分析获得重建图像的PSNR值,在字长相等的情况下,重建图像的PSNR值最大可提高30dB。本文还对传统提升算法和翻转提升算法的定点实现方法进行精度分析方法和优化设计,和已有文献中的定点实现方法相比,在字长相等的情况下,重建图像的PSNR值最大可分别提高6dB和13dB。