论文部分内容阅读
与传统的视频编码相比,感知编码能够节省码率的同时获得更好的视觉感知体验,具有非常大的发展空间。然而,现有的感知模型众多且复杂度高,提出更符合人眼特征的感知模型,以及如何在编码过程中高效利用感知模型,成为感知编码研究的关键问题。为此,本学位论文分析了现有人眼感知模型以及人眼视觉特性,从人眼视觉感知冗余的角度出发,展开人眼感知模型探究及其在视频编码中应用的研究工作。 针对高效视频编码(High Efficiency Video Coding,HEVC)中的码率控制(Rate Control,RC)对于场景突变的序列存在重建视频质量波动大,参数更新不及时等现象。本文提出了一种面向 H E V C图像组(Group of Picture,GOP)级的R C优化算法。首先,统计分析了 GOP内首尾帧差变化情况,用来检测不连续变化的场景;然后,研究每个 GOP分配的比特数与 GOP内帧变化剧烈程度之间的相关性,建立码率分配模型;最后,考虑不连续变化的场景切换对 RC参数更新的影响,以提高 RC的精准性。实验结果表明,在基本不增加复杂度的情况下,本文提出的RC优化方法对于场景突变序列比 HEVC标准算法 PSNR波动减小,且总体率失真性能提升。 考虑目前的恰可察觉失真(Just-Noticeable Distortion,JND)模型在编码应用中的不合理因素,本文提出了面向 H E V C的恰可察觉编码失真(Just Noticeable Coding Distortion,JNCD)模型。首先,分别设计了主观实验研究恰可察觉梯度幅值差异(Just Noticeable Gradient difference,JNGD)的变化规律以及梯度幅值和背景亮度对恰可察觉编码失真阈值的关系,通过统计分析分别建立 JNGD模型和梯度幅值与背景亮度相关的恰可察觉编码失真阈值关系。然后,使用 JNGD模型滤除自然图像通过变差分(Total Variation,TV)分解后的结构图和纹理图中人眼不可察觉的梯度幅值。最后,通过对滤波后图像的分析判别,将原始图像划分为边缘、平坦、纹理三类区域,并分别结合恰可察觉编码失真阈值关系形成自然图像的JNCD模型,最后在HEVC标准测试平台上验证了该模型的可靠性。 立体视频观看时存在掩蔽效应,可以用来指导立体视频编码的非对称编码,从而为传输过程节省大量码率。为此,本文分别设计了主观实验,定量研究视差和梯度幅值对立体掩蔽阈值的影响,通过统计分析得到对应的关系模型。同时,本文结合现有的纹理关于立体掩蔽阈值模型以及帧间编码特性,建立立体视频的双目恰可察觉编码失真(Binocular Just Noticeable Coding Distortion,BJNCD)模型,并且在MV-HEVC标准测试平台上验证了 B J N C D模型的可靠性。同时,利用本文提出的B J N C D模型指导两视点MV-HEVC的非对称编码。与原始平台相比,本论文方法在相同的立体主观感知质量下,辅视点码率平均节省11.41%。并且本文的BJNCD模型更适用于高码率情况,能够为高清、超高清等应用节省大量码率。