论文部分内容阅读
视频编码的主要目的是在确保视频视觉效果尽可能不受损伤的前提下最大限度地降低码率,即实现压缩编码。传统的视频编码技术主要针对视频的空间域冗余、时间域冗余以及统计冗余进行压缩编码,这一类编码技术以增加编码端计算复杂度为代价来获取编码性能的提高,如高效视频编码(High Efficiency Video Coding, HEVC)等,但是其性能提升速度已日趋缓慢。近年来,研究人员开始尝试将人眼视觉系统(Human Visual System, HVS)的感知特性应用到视频编码框架中从而形成了一个新的研究领域——感知视频编码(Perceptual Video Coding, PVC)。经过近年来的发展,结合人眼视觉系统感知特性的感知视频编码研究大致可以划分为两类。第一类是基于视觉注意力模型(Visual Attention Model)的感知视频编码算法,如基于显著性检测算法的视频编码算法,研究人员尝试通过显著性检测算法找出图像中人眼感兴趣的目标或物体,形成一幅显著图,利用显著图来引导视频编码的码率分配。第二类为基于视觉敏感度模型(Visual Sensitivity Model)的感知视频编码算法,如基于最小可察觉失真模型(Just Noticeable Distortion, JND)的感知视频编码算法,最小可察觉失真模型主要致力于发掘并量化图像的视觉感知冗余。基于最小可察觉失真的视频编码主要是利用人眼的视觉掩蔽机制,当编码失真小于人眼敏感度阂值以下的时候,人眼是感知不到的。本文基于现有的人眼视觉系统理论模型,将代表视觉注意力模型的显著性检测算法与代表视觉敏感度模型的最小可察觉失真模型相结合提出一种新的基于显著性区域优先的最小可察觉失真模型(Saliency Region Priority Coding Based JND Model, SRP-JND)。SRP-JND模型利用显著性检测算法检测出图像的显著性,并利用最小可察觉失真模型计算图像的最小可察觉失真阈值,然后利用显著性调整最小可察觉失真阈值:对于显著性较强区域降低最小可察觉失真阈值,对于显著性较弱的区域提高最小可察觉失真阈值。基于提出的SRP-JND模型,将该模型运用到现有的视频编码框架中,提出了一种基于SRP-JND模型的感知视频编码算法。在提出的感知视频编码框架中,利用SRP-JND模型计算出的最小可察觉失真阈值对预测残差进行自适应滤波。为了验证本文所提出的感知视频编码算法的有效性,本文将其实现于HEVC测试模型(HEVC Test Model, HM) HM14.0,本文所提出的感知视频编码算法相对于原始的HM14.0在主观质量非常接近的情况下可以平均节省12.25%的码率。实验结果表明,本文所提出的基于SRP-JND模型的感知视频编码算法可以在确保视频主观质量的前提下进一步去除视频中的感知冗余,减小视频编码码率,提高视频编码效率。