论文部分内容阅读
最近二十年来,图像和视频压缩取得了很大的进步。就压缩效率来说,最新的JPEG2000和MPEG-4 H.264/AVC大大的超过了它们的前几代标准。然而众所周知,任何判断标准都没有视觉质量更具有雄辩力,但所有的编码机制都仅仅考虑象素间的统计上的冗余,而完全忽略了知觉上的冗余,也就是说以往视频压缩编码技术的评价准则以率失真性能(Rate-Distortion Performance)为主,虽然这一指标被广泛采用,但并没有完全反映人类的视觉特性。从本质上来说,压缩机制和视觉系统面临着一个相似问题,即,怎样以一种高效率和有效的方式来描述视觉对象。我们还是有可能在压缩系统中采用某种视觉技术来达到感知保真度而不是象素保真度的。为此,本文对视频图像中的主观视觉质量进行了研究,提出了基于纹理分析与合成的视频编码器和解码器。它主要用一个纹理分析器识别出这些纹理区域,再用一个纹理合成器对这些特殊的纹理区域进行合成。其余的区域则采用传统的视频编码方法进行编码。对于视频图像中纹理区域的检测与划分,本文采用了MPEG-7中EHD和SCC描述子作为相似度准则对图像进行分割与合并。用EHD和SCC作为相似度准则计算各个宏块之间的距离,如果它们之间的距离小于一个给定的阈值,则认为它们的纹理特性相似,就把这两个宏块合并到同一集合中。本文对全局运动估计的仿射模型(Affine Model)进行了一定的研究和分析。对于纹理区域的合成,采用基于仿射模型的全局运动估计得到仿射参数,然后把仿射参数传到解码端,并在解码端对相应的纹理区域进行合成。此外,本文还提出了一种基于碎片缝合的纹理合成的方法。它首先通过时域直接模式得到纹理块的运动向量,然后对运动向量进行纠正。接下来对纹理块用重叠块运动补偿进行处理。之后把每个纹理宏块划分成4个12×12的重叠的碎片,并通过重叠块内像素之间的差异来决定用前向、后向还是双向预测。然后,在重叠区域内找到一条最优的缝,缝的两侧的像素或保留或更新。经过这样的处理,合成后的纹理很好地保持了原来纹理的特性,看上去没有明显的变化。实验结果表明这种纹理合成方法能与基于全局运动模型的合成方法取得相似的结果。