论文部分内容阅读
传统的视频压缩方法主要方法是去除视频数据之间的客观相关性,即时间和空间上的冗余信息。并且码率控制技术平等的对待图像中的每一个编码单元,平均分配码率资源。而人类在观看视频序列时受人眼的视觉机制影响,并没有将注意力平均分配给图像的每一个区域,而是更为关注图像中一些显著性高的区域。本文研究的主要内容就是利用人类的视觉机制进行显著度建模,在提取视觉显著度信息之后,将其用于指导视频编码中的码率分配。其中针对视觉显著度提取,我们提出了一种新的基于曲波变换的显著度模型,该模型可以准确的检测出自然场景中显著性较高的区域;然后又提出了一种适用于视频编码的显著度模型以及基于显著度的宏块层QP调整方案。本文研究的工作主要包括以下三个方面:(1)提出了一种基于曲波变换的显著度模型。该模型首先利用曲波变换得到多尺度的曲波系数,然后进行曲波逆变换重建出多尺度的特征图,最后经过相应计算得到最终的显著度图。(2)提出了一种适用于视频编码的显著度提取方法以及基于显著度的宏块层QP调整方案。首先提出了一种适用于视频编码的显著度模型,该模型包括空域显著度提取、时域显著度提取和空时域的融合策略。然后利用得到显著度值,通过线性微调的策略,将之用于宏块层量化参数的微调。(3)在实验中引入基于眼部轨迹加权的EWSSIM(Eye-tracking Weight Structural Similarity Index,EWSSIM)作为主观性能指标。大量实验表明:本文提出的显著度模型可以准确的提取视频中显著度性高的区域。基于显著度的视频编码可以在保持客观质量的基础上,提高视频的主观质量。