论文部分内容阅读
随着异构网络的逐渐融合以及不同终端设备的不断涌现,视频流在互联网上的应用日益广泛。人们对视频编码提出了更高的要求,即能够动态地根据用户的要求、网络的特性和设备的处理能力提供不同分辨率、帧率和码率的视频。可伸缩视频编码正是针对上述需求而提出的新的视频编码方法。基于运动补偿时域滤波(MCTF)和嵌入式熵编码技术的三维小波视频编码因其能够灵活地实现空域、时域以及质量可伸缩而成为近年来视频编码领域的热点研究内容之一。本文的研究内容正是围绕三维小波可伸缩视频编码展开的。具体地,本论文主要进行了以下几个方面的研究:第一,本文研究了在支持空间可伸缩的条件下如何平衡过完备子带内运动补偿时域滤波(OIBMCTF)方案在低分辨率下解码的不匹配误差和高分辨率下的编码效率。针对这一现有OIBMCTF编码方案所面临的挑战,本文首先对OIBMCTF在低分辨率下解码时不匹配误差的产生和传递进行了理论分析并建立了相应的误差传递模型。在此基础上,本文提出了基于帧的误差减少方案――分辨率层间leaky预测方案和基于宏块的误差减少方案――基于模式的运动补偿时域滤波方案。实验结果显示两种方案都能够有效地减少OIBMCTF在低分辨率下解码的不匹配误差,而且在高分辨率下的编码效率损失相对较小。这两个方案已经正式被MPEG小波视频编码特别小组(Vidwav Group)所采纳作为三维小波视频编码参考软件中子带内运动补偿时域滤波(IBMCTF)方案的基准方法,供所有的MPEG成员使用。第二,本文研究了如何在IBMCTF方案中进行有效的运动预测和编码,提出了一种有效的模式自适应运动预测和编码算法。具体地说,在进行运动矢量预测时,我们充分考虑了空间小波子带间以及每个子带内的运动相关性,引入了三种高频子带宏块运动预测模式,并通过率失真优化模式选择准则自适应地选择最有效的运动预测模式。在对运动信息进行编码时,引入了基于上下文自适应的算术编码框架,并设计了相应的运动预测模式、运动对齐模式和宏块划分模式的概率模型,以进一步提高IBMCTF方案运动信息的编码效率。实验表明,同子带独立的运动预测和编码算法相比,所提的模式自适应运动预测和编码算法对于CIF格式的foreman序列在不同码率下有0.4-0.6dB编码效率的提高,对于4CIF格式的city和soccer序列在不同的码率下平均有0.5-0.7dB编码效率的提高。第三,本文研究了如何将人眼视觉特性同三维小波可伸缩视频编码方案结合以去除视频信号中的视觉冗余,提高视频编码的主观质量。针对“T+2D”编码方案,提出了一种感知自适应MCTF技术。针对“2D+T”编码方案,提出了一种子带内感知自适应预处理技术。在“T+2D”编码方案中,我们在MCTF过程中引入空时视觉掩盖模型来指导MCTF中的运动估计和预测过程以去除视频序列中存在的空间和时间视觉冗余。在“2D+T”编码方案中,我们首先建立了一个局部自适应的小波域JND(Just noticeable distortion)模型。然后在每个空间子带进行MCTF之前插入一个基于该JND模型的自适应预处理模块来去除空间子带内的视觉冗余系数。实验表明,所提的感知自适应MCTF技术和感知自适应预处理算法能够有效地改善解码序列的主观质量。