论文部分内容阅读
传统的二维视频无法给用户提供场景的立体感受,无法满足人们对立体视频的观赏需求。随着视频编码技术的发展,人们开始研究具有网络适应性、用户交互性和真实感的视频编码技术,例如多视点视频编码技术。多视点视频由多个摄像机在多个不同空间位置上拍摄同一场景得到,能够以各种不同的视角观看视频内容并且获得立体视觉感受。但是,视点的增加必然导致数据量的上升,如何高效地压缩视频数据成为当前多视点视频编码研究领域的热点之一。预测结构是提高多视点视频编码效率的重要技术,优化预测结构能提高编码效率。目前,通用的基于分层B帧预测结构是JVT(Joint Video Team)组织发布的JMVC(Joint Multiview Video Coding)软件中定义的。JMVC预测结构不仅消除空间冗余和时间冗余,而且利用视差估计技术消除了视点间的信息冗余。虽然这种预测结构获得了较高的编码效率,但是随机访问性能较差且编码复杂度高。如何改进预测结构,在编码效率和随机访问性之间取得平衡成为进一步研究的关键。本文对多视点编码中的预测结构进行了深入的研究,重点改进了基准视点的选择方法和视点间参考帧的选取方法,实现了编码效率和随机访问性的良好均衡。具体包括:1.MVC(Multiview Video Coding)标准中的预测结构采用的是固定编码结构,无法根据视频序列的属性自适应地调整预测关系。针对这个问题,本文提出一种改进的预测结构I视点选择方法,分析各视点图像与其他视点图像间的结构相似度SSIM(Structural Similarity),选择与其他视点结构相似度最大的视点作为基准视点,在其基础上进行编码。实验结果表明,本文方法能在提高多视点视频编码效率的同时提高随机访问性。2.不同的多视点视频序列具有不同的时空相关性,MVC采用的基于分层B帧的预测结构无法充分利用视频序列的属性。为了进一步提高预测结构的随机访问性能,在改进I视点选择方法的基础上,提出一种基于选择性丢弃的预测结构。通过研究多视点视频图像中的时空相关性和视点间的相关性,分析预测结构中视点间参考帧比例对编码的影响,适当地取消部分时间层(TLID=3和TLID=4)的视点间预测。实验结果表明,基于选择性丢弃的预测结构能够在保持编码效率的同时获得更好的随机访问性能。综上所述,本文所提出的两种改进的预测结构在编码效率和随机访问性能上都比JMVC参考预测结构有所提高,对于多视点视频编码和其他视频编码应用具有一定的参考意义。