论文部分内容阅读
进入本世纪以来,随着互联网技术、移动通信技术和音视频处理技术的渗透融合,新的多媒体业务不断涌现,市场需求快速增长。如何在现有的通信网络和硬件技术条件下实现更高效的视频编解码和更清晰的图像质量是当前数字视频领域的研究焦点。
我国在大规模普及数字电视之初颁布了AVS先进音视频标准,达到了第二代视频编码标准的最高水平,产业链日趋完善。当前,各种新多媒体业务对AVS视频编解码器的性能要求越来越高,特别是直播场合在实时性能上的要求已经超出了普通微处理器的计算能力上限。作为编解码过程中的关键环节,整数变换的延迟是降低高清视频实时性的主要原因之一,提高AVS整数变换模块的处理速度已经成为降低编解码器延时的重要解决途径。
本文针对AVS整数变换模块的快速算法、系统结构和软硬件实现进行研究,实现了高速率的AVS整数变换:
本论文利用Kronecker积和直和分解系数矩阵,推导出一种高速率的AVS整数正变换快速算法,消除了传统算法中的转置环节及其延时,能由高度并行的蝶形算法流程一次性处理残差矩阵的全部元素。
在此快速算法的基础上,本文设计出一种适合VLSI实现的、高速率的AVS整数正变换模块的系统结构。性能分析表明,本文提出的快速算法及系统结构将传统方法的计算延迟降低了近90%,从而在基于专用集成电路方面实现了高速率的AVS整数变换模块。
本文深入分析不同算法模式的汇编实现特征,在Visual C++6.0实现整数变换模块的基础上使用内联汇编,分别应用MMX、SSE2和侧重乘法操作的SSE2等指令技术实现AVS整数变换模块并做优化,从而在基于通用处理器的单指令多媒体技术(SIMD)方面实现了高速率的AVS整数变换模块。
本论文给出的AVS整数变换快速算法、系统结构及基于SIMD的汇编实现方案都有很高的实时性,在AVS科研和多媒体产业中有一定的实用价值。