论文部分内容阅读
立体电影的上马,譬如阿凡达的热映,引发了人们对立体电影的竞相追捧。立体电影的原理是利用人双眼的视角差和会聚功能,而产生了三维立体的效果。多视点视频技术,由于是立体电影的技术基础,而成为了近来研究的热点。因此,多视点视频压缩技术的研究意义重大,前景广阔,十分值得深入地研究。多视点视频生成是由多个摄像机按照一定地几何排布后,对着同一场景,采集而成。由于拍摄的场景大致相同,每个摄像机所拍摄的视频内容往往是表现了同一场景,或仅仅有些不同,比如:物体因为从不同角度拍摄,造成了几何形变扭曲而已。这些相似的大量信息,在时域、空域上存在了大量的冗余信息,于是给视频数据的压缩提供了可能。目前解决的方式有很多种,包托利用当前的现有编码标准,比如:H.264/MPEG-4 AVC去直接编码每个视点下的各路视频,也就是所谓的直接编码方式。除此之外,MPEG-2提出了传统立体视编码的方法,也就是将两路对应于人眼距离的视频,利用时域和空域的依赖关系,压缩编码。目前最主要的方法是采用多视编码框架,由于层次B结构能获得更多的编码增益,因此JvT已经采用了层次B的框架作为标准。它的核心思想是分别运用运动补偿和视差补偿的方法,去掉时域、空域上的冗余信息。虽然国际上的标准已经对立体视频研究了很多年,并且相继制定了很多标准,国内对此研究仍然存在很多空白。AVS作为国内存有自主产权的核心编码标准,对于前沿的研究热点也责无旁贷地投入了研究工作。本研究分为两个部分: 第一,提出了支持AVS立体视频编的系统层技术方案,并被采纳进AVS标准。通过本文所提的提案,可以使得AVS标准在两个层次上实现对立体视频编码的支持。在MPEG系列国际标准中,虽然MPEG-2标准仅支持简单的视间预测编码,H.264 MVC Profile能够支持基于视间预测的视频编码或者基于SEI的拼接编码,但对基于深度的立体视频编码没有任何考虑。相比之下,AVS则在系统和视频两个层次实现了对深度、视间预测等立体视频编码技术的支持。特别是若采用了双视点拼接编码框架,这种单一的多视视频流在视频层上与传统的视频流没有任何区别。在大量节约了码率的同时,也保证了观看质量,并且在实践阶段,此种方式已经提供给了电视观众立体的显示效果,让实时观看成为了可能。 第二,提出了一种自适应的运动跳过模式。此种运动跳过模式(motion skip)在多视框架上,MOTION SKIP模式作为一种新的模式,被收录到研究模型当中。该模式参考附近视点序列中相关的宏块信息,包括:参考帧号,宏块编码模式,运动矢量,从而达到减少冗余信息的效果。然而,本文所提的方法,特别针对的是在AVS下采样辅助的双拼MVC编码框架。由于采用的是AVS编解码器,为了适应其最小粒度的编码单位,本算法采用了8像素精度的运动估计来获得参考图像到编码图像上的全局视差矢量。之后借助预定义窗口大小的细搜索过程,算法可以逐渐找到真实视差和GDV之间的误差。一旦得到最优偏移视差矢量,全局视差矢量会根据搜索结果不断完善优化自己以求达到最匹配真实视差矢量的效果。实验结果表明,通过改进GDV的获得方式,率失真性能得到了显着的提升。综上所述,针对在AVS上实现立体编码问题,利用系统层上的改进,实现了双拼框架和高清实时编码的系统层设计。提出了自适应的运动跳过模式,并通过实验展示了利用自适应地优化全局视差矢量,可以进一步提高编码效率。