论文部分内容阅读
量化是视频编码器的关键模块,直接决定编码器的失真和码率。HEVC等视频编码标准支持众多帧内帧间编码模式,是新一代标准取得较高编码性能的关键。率失真优化是实现高性能模式选择和视频编码算法优化的基础。为实现率失真优化模式选择,常需要计算各种编码模式的编码代价,以实现最小率失真模式选择,这个过程需要变换、量化及熵编码等计算。另一方面,HEVC等视频编码标准常采用率失真优化量化(RDOQ),相比死区硬判决量化(HDQ),RDOQ量化可以获得更好性能;但是RDOQ在确定最优量化值时,需要对多个候选量化值进行穷举搜索,计算复杂度也明显增高。由于率失真优化在模式选择量化过程中所消耗的计算量是非常巨大的,因此迫切需要设计高效的RDOQ算法。由于HEVC采用高效预测,大量变换块(TU)会被量化为全零块,对于小尺寸TU来说,这种概率更高。由于这些全零块不会携带任何有效信息,如果能在RDOQ之前进行快速全零块判决,在保证RDOQ编码性能的前提下,避免RDOQ计算,可以大大降低率失真优化模式选择复杂度。和RDOQ相比,HDQ未采用率失真优化(RDO)准则,直接采用简单除法舍入操作,在支持HDQ的视频编码器中,大多采用基于特定模型的阈值比较来实现全零块预判决,减少量化算法复杂度。RDOQ算法采用动态规划策略从众多候选值选择最优量化结果,如果将传统全零块判决阈值模型直接应用于RDOQ时,全零块检测精度会有一定程度的损失。因此在支持RDOQ的编码器中,需要充分利用RDOQ量化的自身特点,探索更高效的全零块判决算法,以实现计算复杂度节省和量化精度之间的最佳平衡。本文以高效全零RDOQ量化块判决为目标,在分析HDQ和RDOQ量化算法特点的基础上,充分分析RDOQ量化全零块数据统计特点,从多个角度探索不同实现复杂度的全零块判决算法,为不同应用场景的高效量化和模式选择提供算法支持。本文的主要工作如下:(1)分析发现HDQ和RDOQ有较大概率获得相同量化结果,这意味着对于很多样本系数,可以用相对保守的HDQ阈值比较判断全零块,以实现低复杂度RDOQ全零量化块判断。本文先分析HDQ算法特性,结合量化公式推导出适用于HDQ的全零块阈值判决模型。采用相对保守阈值用于判断那些安全的变换块(HDQ和RDOQ量化结果相同块);(2)分析发现HDQ和RDOQ也有一些样本量化结果不同,对于那些HDQ量化为非全零块但RDOQ量化为全零块(奇异样本),本文探索更严谨的判决算法。基于RDOQ算法特性,提出一种面向RDOQ的全零块判决算法。经过先验知识分析和大量样本实验统计结果验证,得出基于量化参数(QP)的自适应阈值判决模型,采用该自适应阈值判决模型对那些奇异样本进行相对准确的全零块预判决。(3)即使采用了上述两种方法,还有一些奇异样本块无法实现精准判断。本文基于RDOQ算法特性和上下文算术编码对码率的影响机理,提出一种基于机器学习二元分类模型的全零块预判决算法。通过理论分析和先验知识,选取了八个影响RDOQ结果是否为全零块的特征参量;将这八个特征参量输入到神经网络中进行训练,得到二元分类模型;这样通过复杂的神经网络刻画复杂的RDOQ过程,实现高精度RDOQ全零块判断。最终的实验结果表明,与理想RDOQ算法相比,本文所提出的多级全零块判决算法在码率增加不超过0.064%的情况下,可平均节省7.471%的总编码时间。第一类错误(False Positive Rate,FPR)和第二类错误(False Negative Rate,FNR)的平均检测率分别为6.5%和6.3%。总之,本文所提算法能较好地平衡计算复杂度和全零块判决准确率,可应用于HEVC编码率失真优化模式选择算法中。