论文部分内容阅读
H.264视频编解码标准中由于运动搜索部分占整个编码时间的权重很大,所以运动搜索算法的效率直接决定了整个编码的效率。因此有必要对运动搜索算法进行多方面细致的研究与改进。另外,由于H.264标准的编解码程序涉及的计算量非常巨大,普通的微处理器难以满足其编码的实时要求,研究应用DSP实现H.264视频编解码具有重要实际意义。本文在认真研究现有视频编码标准H.264关键技术的基础上,从运动搜索算法的改进、多参考帧快速选择算法的改进及H.264编码器的DSP实现与优化等几个角度进行研究。针对视频运动搜索EPZS算法中初始预测矢量繁多的问题,对预测矢量进行了优化,利用空域矢量与时域矢量的特点与关系,确定最优的起始预测矢量,加快搜索;对于在运动估计中避免陷入残差局部最优点的问题,本文还提出两种低复杂度的基于全搜索的快速算法—4T法和基于简单查表的SAE复用快速算法;在多参考帧快速选择算法的改进方面,为了避免搜索多余的参考帧,本文提出了一种低复杂度参考帧确定算法来快速确定当前宏块所需的参考帧。最后,论文还对H.264标准进行了DSP实现与优化。主要介绍如何在TMS320DM642硬件开发平台上进行H.264“baseline”编码器的开发。在原x264编码器程序基础上对其进行了针对性裁减、修改并最终移植到DSP平台上运行,利用内联函数、线性汇编等对H.264核心算法和程序进行改进,提高代码运行的并行性。另外,结合已提出的基于简单查表的SAE复用快速算法,论文还充分利用DM642两级Cache的特点对编码器程序进行了优化。实验结果表明,对EPZS改进后的算法在搜索性能上和EPZS算法相比有很大提高,信噪比也基本相当;4T算法和SAE复用快速算法也能做到在较低的信噪比降低的前提下大大加快运动搜索的速度;而低复杂度参考帧选择算法虽使峰值信噪比有轻微的降低,但编码所用的时间提高2倍之多;利用DSP实现的H.264编码器每秒钟能够完成28~38帧QCIF格式图像的编码。