论文部分内容阅读
随着计算机、通信及网络技术的发展,实时的2D视频可视通信己经走向成熟,基于各种国际标准的视频产品已经进入了人们的生活、学习、工作等各个方面。然而,人们对于数字视频的要求日益提高,人们希望看到表征自然景物的数字视频能够更加地清晰、更加地真实,而2D视频在真实性上存在很大的局限,为满足视频场景自然和真实再现需求,具有3D视觉功能的多视点视频技术正越来越受到学术界和工业界的重视,并成为近年来视频研究的热点之一。多视点视频蕴涵了景物的深度信息,在自然场景的表征上更具真实感,下一代多媒体应用将朝着网络化、交互性和真实感的方向发展,多视点视频编码(Multi-view Video Coding)作为FTV(Free-viewpoint Television)、3DTV(Three-DimensionaTelevison)等三维视频应用中的核心技术之一,是针对即将出现的交互式多媒体应用提出的,它将解决3D交互视频的压缩、传输和存储等问题。然而多视点视频具有巨大的数据量,存贮和传输十分困难,必须对其进行高效的压缩。在多视点视频中,除了各个视频流内具有很强的空间和时间相关性,各视点之间也具有一定的交叉相关性,如何有效地利用这些相关性是提高多视点视频编码效率的关键。为提高多视点视频的压缩效率,本文在多视点视频编码的运动估计、视差估计与多参考帧选择等方面进行了研究。本文首先分析了多视点视频编码相关的原理和技术;研究利用H.264/AVC进行多视点视频编码的方法;在JVT(联合图像专家组)的多视点视频编码的参考模型JMVC平台下完成了两种多视点视频编码算法,第一种算法将两路相对固定相机拍摄的视频,通过求出相机内外参数,实现两路视频图像的基于对极线的校正,将视差估计的二维搜索变为一维,再通过建立原始图像和校正图像的索引表来加快视差估计的搜索速度。该方法将编码速度在原模型基础上提高了30-40%。第二种算法针对目前多视点视频编码(MVC)求最佳参考帧都是采用从7种模式中遍历找出最佳参考帧这一特点。提出了基于多参考帧选择的提前终止算法。利用最小率失真代价是否小于阈值进行终止搜索判断,在很大程度上降低多参考帧运动搜索的计算量。该算法在保证图像质量和码率几乎不变前提下,进一步减少90%-80%左右的搜索点数。通过对多种视频序列的测试,该算法具有良好的鲁棒性,适用于需要实时多视点视频编码的应用环境。