论文部分内容阅读
图像/视频压缩编码是实现多媒体通信的关键。传统基于块的视频/立体视频压缩编码算法,因其平移的块运动/视差模型不能反映图像的真实运动/视差场,所以在甚低码率下,预测图像几乎不可避免地都会出现块效应,直接影响编码效果。为克服该类问题,基于对象的压缩编码算法将视频分割为各个对象,采用接近物体真实运动/视差的模型来描述图像的运动/视差场,但其难点在于实现视频对象分割。基于网格模型的压缩编码方法则可利用网格的连续形变有效地补偿视频对象的平移、旋转和缩放等造成的图像运动变化,同时网格的生成比视频对象的分割相对简单,因而成为近年来的研究热点。DT(Delaunay Triangulation)模型是压缩编码模型中常用的网格模型之一。基于DT网格的图像描述方法,其三角形网格节点在图像变化剧烈的地方比较密集,而在平坦的地方较为稀疏,网格节点可看成是图像的特征点。这种特性是许多应用(如图像编码、图像识别等)所需要的。
本文以DT模型基图像描述为基础,对。DT模型基编码技术进行了深入系统的研究:通过分析DT模型基应用于图像/视频编码的优缺点,改进了DT模型基的图像描述方法;深入研究了DT模型基视频及立体视频编码的重点环节,诸如运动/视差估计、残差图像处理等。主要研究内容和创新如下:
1)针对DT模型基图像编码方法不能实现实时编码的不足,根据图像的多分辨率表示方法,采用分层搜索的思想,提出了一种快速DT模型基图像描述方法。该方法通过逐渐精细的搜索步长搜索网格节点,减少了逐点搜索的次数,从而节约了时间,提高了运算效率,为实现DT模型基图像和视频实时编码奠定了一定的基础。
2)利用DT网格分析了彩色视频亮度和色度分量中目标之间的相关性,并利用这种相关性提出了DT模型基彩色视频编码方案。该方案仅对亮度分量进行DT网格描述,通过相似变换完成对色度分量的DT网格描述。在帧间编码时还采用了连续网格运动估计技术,避免了对每一帧都进行DT描述,同时与IVIPEG-4标准对运动预测过程中DT结构要保持不变的要求相一致。因此,该方案节约了编码时间和编码比特数,提高了编码效率。
3)深入研究了DT模型基立体图像/视频编码算法。首先,提出了一种可以保持DT网格拓扑结构不变的视差估计方法。其次,将这种视差估计算法和互对应(Cross Correspondence:CC)约束条件相结合给出了立体图像的编码方案,其中CC用来判断视差估计的准确性。然后,利用运动估计和视差估计中要保持网格拓扑结构不变这一前提条件,提出了一种基于DT网格的运动和视差估计相联合的立体视频预测算法。该算法以三角形为补偿单元,根据图像内容灵活地在运动估计和视差估计之间做选择,从而使得预测图像的质量最优。最后,把这些算法集成到立体视频编码中,给出了DT模型基立体视频完整的编码方案。
4)对适合网络传输的DT模型基渐进式视频编码进行了初步研究。按照DT网格节点在图像描述中的重要性顺序提出了DT模型基视频I帧图像渐进式编码方案。根据DT网格运动估计的特点,结合比特平面编码技术,提出了基于DT网格的视频P帧图像的渐进式编码方案。这些方案和MPEG-4 FGS一样把比特流分为基本层和增强层,解码器可以根据网络情况在增强层的任何位置停止解码,在甚低码率下可以提供更好的质量。
5)将DT网格模型引入图像分割领域。对图像DT描述后,通过分析网格节点的密度先提取比较清楚的目标轮廓,然后结合一些基本的图像处理算法轻松地实现了图像的目标分割。