论文部分内容阅读
视频编码技术作为现代信息技术中不可或缺的组成部分,是解决图像、视频数据爆炸式增长所带来的传输与存储问题的有效手段之一,被广泛地应用于各个多媒体技术领域。HEVC是H.264/AVC视频标准之后,由ITU和ISO/IEC两大国际组织再次联合制定的最新视频编码标准。从视频编码标准的发展历程和技术特点来看,在受限的条件下获得最优化的编码性能和最佳的计算效率,依然是当前视频编码设计的核心问题。随着研究者们对人类视觉系统(Human Visual System, HVS)和心理学的深入研究,发现HVS对视频场景、图像区域的视觉感知是有主观选择性的、多维度的,即对视频场景或者图像中不同的区域或者对象,人类视觉感知的结果是不一样的。同样地,对于多维度的特征,例如亮度、纹理、运动、边缘、位置特征,人类视觉敏感度的结果也会存在差异。该发现已在视觉神经科学研究中得到广泛地证明。然而,在传统的视频编码算法中,各种视觉感知特性并没有得到充分利用。因此,将视觉感知特性与视频编码相结合,可以改善编码效果、提高计算效率和优化主观质量评价等,具有重要的理论研究意义和应用价值。基于以上背景,本论文展开了基于人眼视觉感知的视频编码关键技术的研究。(1)本论文首先从实验数据分析的角度,统计HEVC中各功能模块的耗时情况,得出优化CU深度划分和率失真优化过程可以实现HEVC编码加速。在加速CU划分过程中,充分地考虑编码块区域的纹理复杂度和运动强度,同时在此过程中引入视觉感知权值,即人眼易于重点关注视频场景的中心,构造一个提前终止CU划分的判决条件;接着根据同位块与当前块之间的统计关系,从纹理方向角度,给出当前块最大的划分深度,从而实现加速CU划分过程。在优化率失真代价判决过程中,本论文将CU划分与否视为二类分类问题,引入贝叶斯分类算法,对待编码块给出的特征通过与使用贝叶斯分类算法计算出的阈值进行判断,对于满足在低风险的特征区间,则使用贝叶斯来判定是否划分,否则使用率失真代价判决。实验结果分别证明本论文提出的算法的正确性。(2)本论文首先提出了一种改进的帧层码率分配模型,该模型考虑了视频帧之间以及GOP之间的内容差异性和连续性,将视频内容复杂度引入到帧层码率分配过程中。实验结果证明了本论文提出的算法的合理性。其次,本论文还针对人眼视觉系统的特性,对现有视频编码中的LCU层码率控制方案进行改进。根据人眼视觉的敏感性将输入待编码帧划分为:显著性区域与非显著性区域。对于处于不同区域中的LCU采用分而治之策略,从而实现更好地码率控制性能。(3)本论文提出了一种基于压缩域视频的显著性检测算法。与图像显著性检测算法不同,该算法主要利用压缩码流中的DCT系数和MV运动信息。由于这些特征都是经过编码器中多种算法甄选出来的,不仅仅可以准确的跟踪物体运动的轨迹和图像的纹理特征,还可以隐式地表征视频的显著性。本论文通过构建一个移动的视觉窗口,使用熵分别地计算出时空域的显著性图,并使用类方差方法进行融合生产视频显著性图。另外,由于人眼感知系统对运动信息较为敏感,而在自然视频中,背景运动和前景运动信息往往混合在一起,给计算运动显著性带来诸多困难。本论文在借助全局运动估计的基础上,使用统计方法,分析物体的相对运动和绝对运动,从而有效地推导出运动感知权值,并将其应用于运动的时域显著性图上,准确地预测出人眼关注的运动区域,从而有效地提高视频显著性检测算法的准确度。