论文部分内容阅读
随着计算机图形学和计算机视觉技术的发展,多视点视频(MVV)越来越多地引起人们的普遍关注。同传统的单视点视频相比,多视点视频拥有丰富的三维深度信息,能够为用户提供无法比拟的立体感和交互性。然而,由于多视点视频是由位置固定的多个摄像机同时从不同角度拍摄同一场景而获得的一组视频信号,其数据量会随着摄像机数目的增多而成倍增加。巨大的视频数据量对存储和传输提出了更高的要求,多视点视频编码(MVC)就是对多视点视频数据的有效压缩。随着新一代显示技术的发展及网络传输能力的快速提高,多视点视频编码越来越受到国内外学者及研究机构的青睐。多视点视频编码沿用传统的混合视频编码框架结构,并对该框架进行了拓展和创新,复杂的预测结构带来了计算复杂度的急剧增加,巨大的计算量严重影响了MVC的实际应用和推广。因此,研究MVC低复杂度快速算法至关重要。在多视点视频中,除了具有同一视点的时间和空间相关性以外,还具有同一时刻不同视点间的视点相关性。因此,如何有效地利用这些视点内及视点间的相关性信息来去除冗余是提高多视点视频编码速度的关键。论文在对多视点视频编码相应关键技术深入分析的基础上,对其中的耗时模块进行了一系列的优化。首先,在对多视点视频编码各个模式分析的基础上,针对MVC模式分析计算量大的缺点,提出了一种有效的Direct模式提前终止模式选择快速算法。基于Direct模式最有可能成为最优模式这一观察,算法首先计算当前宏块的Direct模式的率失真代价(RD cost)值,并与自适应阈值进行比较,以提供一个提前终止的机会。如果当前宏块的RD cost值小于自适应阈值,那么Direct模式将直接被选为最优模式,其余的模式选择过程不必检查;否则,将进行穷尽模式搜索来选择最优模式。自适应阈值的设计是算法实现的关键,该算法综合利用了当前宏块与其相邻宏块的空间、时间及视点间的相关性来共同确定。实验结果表明,同MVC参考软件的穷尽模式选择算法相比,提出快速算法降低了约72.38%的计算复杂度,总比特率平均减少了1.06%,而PSNR仅下降0.05dB。其次,通过对MVC帧间预测可变尺寸块中各个尺寸块分布特点的分析,提出了基于模式复杂度的多视点视频编码帧间预测快速算法。在提出的算法中,根据所定义的模式复杂度将宏块分成3个不同的模式类型,每种类型仅检查相对应的模式分块,其余不必要的模式分块就可以提前终止,从而使得计算量大大减少。实验结果表明,同全模式选择算法相比,提出算法在保持编码效率基本不变的同时,计算复杂度减少62.75%。再次,针对多视点视频编码视间预测效率低的问题,提出了视差估计提前终止的视间预测快速算法。提出的方法是基于帧间各分块模式之间的预测方向的相关性而提出来的,采用帧间16×16模式在视点方向的预测结果来确定其他模式是否进行视差估计。实验结果表明,提出算法能够有效地跳过不必要的视差估计过程,从而有效地降低多视点视频编码视间预测的计算复杂度。最后,基于上述算法,本文提出一种融合算法。该算法融合了Direct模式提前终止算法、可变尺寸块帧间预测算法和视差估计提前跳过算法。实验结果表明,该融合算法能够最大限度地降低多视点视频编码的计算复杂度,平均可降低78.79%,同时比特率可以降低0.07%,而PSNR值仅仅降低了0.04dB。综上所述,本文分析了多视点视频编码的各关键技术,并对相应的模块进行了优化研究。所提出的快速优化算法能够很好地降低多视点视频编码的计算复杂度,对多视点视频编码的应用具有重要的参考价值。