论文部分内容阅读
本文在继承前人研究成果的基础上,对图像和视频编码若干算法进行了研究,提出了三种改进型的图像和视频编码算法。主要工作如下:
⑴提出了一种小波精细可伸缩图像编码算法。编码比特流包括基本层和增强层两部分。基本层比特流不具有可伸缩性,但具有更高的压缩效率。增强层比特流采用嵌入式的编码方式,在任意点截止都能够正确解码。在基本层编码中,为了提高编码的压缩效率,低频子带系数作为一个整体独立编码,高频子带系数以小波块为单位,分块进行量化编码。增强层编码则采用位平面编码方式,基本层编码后的差值信息,按照由低频子带向高频子带的顺序,逐个子带进行位平面扫描编码。采用这样的比特流结构,本章算法兼顾了压缩效率和编码比特流的可伸缩性。实验表明,本算法在同样的编码比特率条件下能够获得比3PEG-2000和SPlHT算法更好的图像质量。
⑵提出了一种小波低频预测图像编码算法。图像经过多级小波变换后,能量集中于低频子带,低频子带系数可以用很少的编码比特有效表示。基于这一特点,本章提出了小波低频预测的编码框架,用小波低频子带重建出模糊的图像对原始图像进行预测编码,对于低频预测后得到的差值图像,采用自适应分块变换编码,编码器支持8×8,8×4,4×8和4×4四种大小的整数块变换。为了确定最优的变换块尺寸,拉格朗日乘数法被用来在编码比特数和重建失真之间进行权衡。试验结果表明,小波低频预测图像编码器能够获得比SPIHT和JPEG2000编码器更好的压缩效率,重建图像的主观质量也获得了提高。
⑶提出了一种脸部区域增强低比特率头肩像视频编码算法。低比特率编码条件下,很难同时保证所有的图像内容都具有完美的质量,在头肩像视频中,人脸区域包含了最重要的图像信息,如果能够快速地在视频中定位和跟踪脸部区域,有针对性地对脸部区域进行比较精细的量化和编码,就可以在有限的编码比特率条件下,大大提高重建视频的主观质量。