论文部分内容阅读
多视点视频蕴涵了景物的深度信息,可以实现一定视角范围内任意三维场景的重建,在自然场景的表征上更具真实感和临场感,满足了人们对数字视频应具有立体感和交互性的需求,是现阶段表征三维视频信号的重要方式。多视点视频技术可广泛应用于自由视点电视、增强现实、自然用户界面等领域,近年来受到学术界和工业界的广泛关注。但是,多视点视频数据量巨大,必须采取有效的压缩和传输机制,以达到实时网络传输和应用的要求。国际联合视频小组已于2009年6月颁布多视点视频编码标准,并将其作为H.264/AVC的High Profile。 本论文深入研究多视点视频压缩编码快速算法,主要研究内容与成果如下: 1.引入立体-运动约束模型来描述相邻视点图像的运动和视差矢量关系。基于立体/多视点视频的序列相关性,结合时空域的多参考帧技术,建立立体-运动约束模型,有效描述立体/多视点视频相邻视点图像的运动矢量和视差矢量关系。根据立体-运动约束模型,使当前编码块的运动/视差矢量可以由相邻立体图像对的另外三个预测矢量通过迭代方法运算得到,极大降低搜索复杂度。 2.提出一种高效的运动和视差矢量联合迭代搜索算法。设计运动和视差矢量联合估计快速算法,改进传统的中值矢量,采用可靠的预测初值作为搜索起始点,设计迭代搜索策略将运动估计和视差估计的结果互为利用;另外,针对立体-运动约束模型在遮挡区域准确度降低等问题,提出基于多覆盖块的候选预测矢量选取策略,采用一种自适应的滑动搜索窗口,通过可信度因子自适应地调整修正窗口,避免算法陷入局部极小值,减少误匹配的可能性,并且通过多次更新立体-运动模型,不断修正运动/视差矢量直到逼近最佳值,在保证编码质量的同时大幅减少编码时间。 3.提出一种多视点视频编码双向预测提前终止算法。通过对多视点视频编码中双向预测B帧的前向、后向和双向预测类型展开分析,探索双向预测类型与量化参数、HBP结构时序层次,以及运动-立体约束模型的模型误差之间的相互关系,提出一种双向搜索提前终止算法,在满足终止条件时跳过不必要的双向搜索步骤。实验结果证明该算法能够在保证编码质量的同时进一步提高多视点视频编码速度。 4.提出一种基于深度图的多视点视频编码宏块模式快速选择算法。基于深度图的多视点视频编码不仅利用多纹理视频数据的时间、空间以及视点间相关性,还利用深度图序列和纹理视频数据的结构相关性,最大限度地去除冗余信息实现高效编码。本论文提出一种新的基于深度图的多视点视频宏块模式快速选择算法,结合相邻视点参考帧的宏块模式分布信息和深度图中对应块的平坦程度来描述运动信息和深度特征的关系,联合对多视点视频宏块编码模式进行提前判定,实验结果证明该方法能够显著提高多视点视频编码速度。