论文部分内容阅读
高效视频编码(HEVC)标准和H.264/AVC标准是由国际标准化组织IOS下属的运动图像专家组MPEG和国际电信联盟电信标准化组织ITU-T下属的视频编码专家组 VCEG联合制定的视频压缩编码标准。与以往的视频编码标准相比,它们均包含了许多复杂的帧内和帧间预测编码工具、变换域的熵编码工具以及自适应的滤波器,从而进一步提高了视频压缩的性能。在比特率受限的情况下,为了取得最优的压缩效率,使得编码失真最小,同时能在解码端获得较好的视频质量,率失真优化技术显得尤其重要。 在深入理解HEVC和H.264/AVC视频编码标准的基础上,本文首先介绍了率失真优化技术(RDO)的基本理论,总结了近年来率失真优化技术领域最前沿的研究成果。其次,针对率失真优化过程中的不足之处,本文提出了几种新的率失真优化模型,并将其嵌入到视频编码的模式选择过程中。本文的主要工作集中在以下几个方面: 1.提出了一种感知率失真优化方法。通过考虑人眼视觉系统(HVS)的特性,利用基于自由能的恰可觉察失真(FEJND)模型计算视频的某一帧中每个像素点的JND值,接着将该视频帧划分为有序区域和无序区域,并调整率失真优化过程中的拉格朗日乘子和量化参数QP,从而为一帧中的不同区域分配不同的比特率。实验结果表明本方法在保证视频重建质量的前提下,大幅度降低了编码比特率。 2.结合FEJND模型改进率失真优化过程中的失真模型,舍弃人眼不可觉察的失真,建立更符合人眼视觉感知特性的新失真模型,同时进一步调整拉格朗日乘子和量化参数QP,优化代价函数。实验结果进一步证明了本方法在减少画面视觉冗余,提高编码效率方面的有效性。 3.提出了一种基于结构相似度(SSIM)的RDO模型。首先利用编码过程中离散余弦变换(DCT)系数的绝对平均值来描述视频的复杂度,通过大量的实验发现了比特率和视频复杂度及量化步长之间的关系。其次建立了基于SSIM的线性失真模型。最后利用拉格朗日方程将两个模型结合求取率失真优化过程中新的拉格朗日乘子。该方法自适应性强,在降低视频编码比特率的同时也提高了视频的主观质量。 4.提出了一种基于感知块合并的HEVC优化方法,该方法被用在高动态范围(HDR)视频压缩编码中,以此来减少HDR视频对内存和带宽造成的巨大压力。通过考虑人眼视觉的无序掩蔽效应,确定一个视觉权重参数来自适应的调整RDO过程中的拉格朗日乘子。实验表明,人眼不敏感区域(无序区域)的图像块更倾向于被合并成较大的块,而敏感区域(有序区域)的图像块更容易被分成更小的块以便进一步节省编码的比特率,提高重建帧的质量。重建后的HDR视频质量有所提高。