论文部分内容阅读
随着人们对于通信、计算机网络、数字多媒体等技术的不断关注和依赖,多视点视频将成为未来数字电视的重要发展方向。与传统的单视点二维视频相比较,多视点视频与人们的视觉需求更加匹配,它能够提供丰富的立体感和沉浸感,并可以根据用户需求自由切换观看角度。多视点视频在给人们带来在全新感官体验的同时,其本身庞大的数据量也对现有多媒体信息处理、通信网络传输等技术带来了巨大的挑战。如何利用有限的参考视点生成高质量的虚拟视点成为多视点视频发展的内在要求。本文从多视点视频系统的基本需求和目标出发,围绕着新视点合成问题进行了深入地研究,提出了适用于该系统的内容表示和视点重构方法。本文的主要工作内容和成果可归纳如下:1)针对立体匹配问题提出了一种基于多测度融合的匹配代价建立算法。该算法利用基于梯度的Census变换(Gradient-based Census Transform, GCT)、绝对色彩差(Absolute Color Differences, ACD),以及Gabor模式差(Gabor Pattern Differences, GPD)三种测度,从不同特征模式入手,多尺度、全方位地刻画了参考图像和目标图像之间的关联特性,通过全面提取图像区域的边缘信息、纹理特性、色彩差异、方向属性等特征,建立起完整统一的匹配代价计算模型,从而为精确地像素匹配提供了充足的保障。2)针对传统代价聚合计算复杂度高以及视差优化存在歧义性的问题,提出了一种基于引导滤波器和自适应可信度图的优化算法。该算法采用的引导滤波器不但可以出色地完成传统的代价聚合任务,而且在代价聚合实施过程中,有线性复杂度的计算模型,这使得其运算量不依赖于聚合窗口的大小,而仅仅取决于被聚合图像的总像素点数目,从而明显提高了代价聚合的计算效率。另外,传统的WTA(Winner-Take-All)算法可能由于代价选择的歧义性而引入匹配误差,使用自适应可信度图算法可以有效选择和替换可靠度较低的视差像素点,从而进一步提高了匹配结果的可靠性。3)针对逐帧生成的深度图序列在时域上不连续进而引发闪烁噪声等失真问题,提出了一种基于自适应时域梯度滤波的空时一致性视差序列估计算法。该算法不仅避免了对全局能量最小化、光流场等复杂问题的求解,而且可以与现有的单帧立体匹配算法无缝兼容,在算法应用范围、可行性、计算复杂度等方面都有独特的优势。4)针对新视点合成中因视点遮挡而产生的空洞失真等问题,提出了一种基于全局背景图的新视点合成算法。该算法立足于从视频序列的帧间信息中提取空洞区域的真实像素值,并结合图像本身的纹理特征完成对空洞区域的修复。同时,与传统的至少需要使用两路参考视点来绘制中间虚拟视点的方法相比,本文算法仅需一路参考视点,这不仅能够有效降低带宽占用率,而且还可以不再受中间位置的限制,能够提供更广阔的虚拟视点合成范围。总得来说,本文针对多视点视频中的立体匹配、深度图时域连续化、视点合成、空洞失真修复等关键问题进行了较为深入地研究,为面向多视点视频的新视点合成技术的进一步发展做出了有益地探索。