论文部分内容阅读
随着3D显示技术及交互式多媒体技术的发展,立体电视和自由视点立体电视等3D视频应用得到了工业界和学术界的广泛关注。为了高效地表达3D场景,多视点加深度的3D视频格式被广泛采纳并得到了深入的研究。深度视频具有不同于传统视频的特性,由大量的平滑区域和尖锐的边界所构成,具有分段平滑特性。同时,由于深度视频和彩色视频都表示同一场景,因此深度视频和彩色视频之间存在运动相似性和结构相似性。传统的视频编码方法在深度边界部分不能获得较好的预测,会产生较大的残差,影响编码效率。本文充分利用深度视频独有的特性,对深度视频的高效编码方法展开了研究。本文首先深入研究了彩色视频和深度视频之间的运动相似性和结构相似性,并基于该相似性提出了一种新型的深度视频编码方案。该方案中包括基于加权平均的多方向预测方法,基于深度彩色联合聚类的帧内预测方法以及深度边界与彩色边界的边界不对齐检测及处理算法等。实验结果表明,所提出的方案能显著提高深度视频的编码性能。在深度视频的帧间预测方面,本文提出基于像素级预测的编码方法。该方法采用已编码的彩色视频估计场景的运动,并利用深度视频和彩色视频之间的运动相似性,协助深度视频编码。基于已编码的彩色视频估计场景的基于像素的运动矢量,通过彩色视频和深度视频之间的映射过程,将基于已编码的彩色视频估计的基于像素的运动矢量映射至深度视频中协助深度视频编码,同时不需要传输任何运动矢量,提高了深度视频的编码效率。