论文部分内容阅读
多视点视频是利用不同位置的摄像头对同一场景进行拍摄得到的视频数据。它包含了丰富的3D场景信息,可以为用户提供传统单视点视频无法比拟的视觉感受。由于多视点视频的数据量随着视点个数的增多而成倍增加,多视点视频编码(Multiview Video Coding, MVC)对多视点视频数据进行高效的压缩,以解决多视点视频数据传输和存储的问题。随着新一代显示设备的出现以及用户对真实视觉感受的需求,多视点视频编码受到了国内外研究机构和学者的广泛关注。多视点视频编码的计算复杂度随视点个数的增加而增大,并且由于它采用了比传统视频编码更为复杂的预测结构来提高编码效率,其单个视点的计算复杂度也相应增加,因此多视点视频编码巨大的计算复杂度严重影响了它的实际应用。而传统的视频编码快速算法没有考虑多视点编码新的特点,如将其直接用于多视点视频编码,得到的效果并不理想。因此,如何充分利用多视点视频编码新的特性,对多视点视频编码的快速算法进行研究具有重要的理论意义和应用价值。本文正是在这种研究背景下,展开了对多视点编码快速算法关键技术的研究。第一章绪论部分首先阐述了选题的意义,然后综述了国内外研究现状并作相应的总结,最后介绍了本论文的主要研究内容和论文组织结构。第二章提出了一种基于纹理区域分割和多种相关性的模式分析快速算法。该算法首先利用Intra模式率失真代价及其在视点间的相关性将每帧图像分割成高纹理、中间纹理和低纹理等三类纹理区域;然后利用视点间Skip模式率失真代价的相关性和纹理区域类型,提前判定Skip模式为宏块最佳模式;接着利用Inter模式之间视点方向预测的相关性和纹理区域类型,判别是否进行视点方向预测;最后利用Inter8×8模式与纹理区域的相关性以及宏块运动活跃性,判别是否进行Inter8×8模式估计。第三章对多视点视频编码帧间估计快速算法进行了研究,帧间估计分为视差估计和运动估计两种。首先针对视差估计提出了一种基于视差矢量时空相关性的视差估计快速算法。该算法先对已编码帧的视差矢量场进行矢量方向规则化和空间中值滤波,消除其中的噪声视差矢量,以获得与真实视差一致的视差矢量场;然后利用该视差矢量场从时间方向加权预测真实视差矢量;接着利用视差矢量的时空相关性,为视差估计选取接近最佳视差矢量的搜索中心、;最后利用搜索中心与真实视差矢量的偏离程度来自适应预测视差估计的搜索范围。同时针对运动估计提出了一种基于运动矢量视点间/空间相关性的运动估计快速算法。该算法首先对邻近视点已编码帧的运动矢量场进行空间中值滤波,消除其中的噪声运动矢量,以获得与真实运动一致的运动矢量场;然后利用全局视差矢量从邻近视点滤波后的运动矢量场中选取反映真实运动状态的参考运动矢量;接着根据运动矢量的视点间/空间相关性,为运动估计选取接近最佳运动矢量的搜索中心;最后利用搜索中心与参考运动矢量的偏离程度来自适应预测运动估计的搜索范围。第四章提出了一种基于多视点视频编码分层B帧预测结构的计算复杂度控制算法。该算法首先为GOP组(Group of GOP, GGOP)、超帧(Super Frame, SF)、帧和宏块等不同粒度编码层分配计算量,其中宏块层利用了零矢量处像素差值的绝对值的和(Sum of Absolute Difference, SAD)与纹理强度进行计算量的自适应分配;然后对宏块模式分析的计算量进行分配和控制;最后对宏块的帧间估计的计算量进行分配和控制。本章进一步将该计算复杂度控制算法与第二章的模式分析快速算法以及第三章的帧间估计快速算法的相结合,以实现快速算法下的计算复杂度控制。第五章总结了本论文的研究成果,并提出了下一步研究的方向和任务。