论文部分内容阅读
三维视频以其独特的身临其境的视觉效果引起了消费类电子产业和广大消费者的兴趣,也激发了学术界的研究热情。多视角视频是一种三维视频表达形式,可以让用户在一定范围内自由选择观看视频场景的位置和角度,近年来得到了迅猛发展。但是多视角视频的数据量随着视角数目成比例增加,给三维视频的制作、存储和传输带来极大的负担。多视角加深度(Multi-view Video plus Depth, MVD)形式的三维视频通过附加的深度图像以及视角合成技术,可将有限视角的视频扩展到任意视角,成为目前最具潜力的三维视频表达形式之一。
深度图像的压缩编码是新一代三维视频编码标准的重要组成部分。深度图像具有明显的结构特征,将面向自然视频的视频编码国际标准H.264/AVC、HEVC中的帧内预测方法直接应用于深度图像并不能获得理想效果,尤其在任意形状的深度边缘处,较大幅值的预测误差不但会增加变换域系数而耗费较多的比特进行编码,而且会在重建的边缘形成明显的振铃效应,严重破坏了合成视角视频的主客观质量。本文在传统的帧内编码框架下,根据深度图像的特点,对深度图像的帧内编码算法进行研究和改进。本文的主要工作以及创新之处在于:
1.在H.264/AVC框架下实现了一种基于边缘自适应的帧内编码算法。该算法首先沿着深度边缘在16×16宏块或8×8块中提取一系列4×4子块,形成一种灵活的块分割方式,然后以码表的形式高效地传输子块内部的深度边缘形状信息,大大提高了边缘的预测精度。重建的边缘区域可以联合已编码的相邻块一起预测剩余的平坦区域,提高了帧内编码的整体效率。
2.将基于边缘自适应的帧内编码算法扩展到HEVC框架下,并结合HEVC的特点进行适当改进。新算法首先沿着深度边缘从64×64至8×8的编码块中提取一系列子块,再对这些子块内部的边缘形状进行建模。子块的尺寸是可变的,能对深度边缘形状形成不同精度的描述,从而更好地适应不同码率的要求。
实验表明,本文所提算法在H.264/AVC和HEVC框架下均显著地提高了深度图像的帧内编码性能,不仅提高了深度数据本身的压缩效率,而且改善了合成视角的主客观质量,尤其在边缘噪声少、边缘分布广、边缘不规则的深度图像编码中发挥的优势更为明显。