论文部分内容阅读
在下一代视频技术中,立体视频作为一种比普通视频提供更多信息内容和具有更多数据量的数字媒体,因其具有强烈的立体感和纵深感特性越来越受到人们的关注。立体视频蕴含了景物的深度信息,在自然场景的表征上更具有真实感,在3D电视、具有临场感的可视会议及虚拟现实等领域展现了广阔的应用前景。然而立体视频具有两倍于单目视频的数据量,这给存储和传输带来困难,必须对其进行高效的压缩。在立体视频中,除了各个视频流内具有很强的空间和时间相关性,各视点间也具有一定的交叉相关性,如何有效地利用这些相关性是立体视频走向实际应用的关键。为提高多视点视频的压缩效率,本文根据人眼视觉系统的隐藏特性,对非对称立体视频压缩编码中的关键技术进行了研究。论文首先对基于H.264的立体视频编码技术和其相关参考模型JMVM进行深入研究,并分析了三种传统编码方案的优缺点。在对结果分析的基础上,得出了视差估计、运动估计及联合估计的不同应用环境。得出运动补偿主要是发生在不运动的背景区域和运动缓慢的前景区域以及相邻两帧中的遮挡区域,视差补偿主要是用于运动引起的遮挡、变形区域。联合补偿预测主要是发生在物体的边缘区域。在根据人眼视觉特性的基础上,分析了非对称视频编码应用的可能性。并指出了现有的非对称立体视频编码算法中右视角图像在参考左视角图像时存在的问题,引出了一种快速的匹配算法——参考帧直接预测模式,该算法与已有算法中对左视角参考帧进行动态下采样相比,降低了编码的复杂度。同时论文分析了非对称立体视频编码过程中的右视角下采样图像编码失真度原因,引出了一种更有效的非对称立体视频压缩编码算法,并能够根据目标码率来动态的选择采样尺度,在失真度和码率之间寻找一个最优点。最后,本论文在现有立体视频采集系统的基础上,研究了实时立体视频显示技术。设计并实现了一个基于Bumblebee2双目视频摄像机的立体视频实时采集和显示系统,该系统采用最新的DirectX 3D渲染技术,将摄像机采集来的立体视频数据以分色或者是分时方式实时显示在普通CRT显示器上,用户可以根据不同需要欣赏到具有深度感的立体视频,同时可以将采集的立体视频保存为AVI格式的视频流,便于进一步的研究。