论文部分内容阅读
随着信息社会的到来,多媒体应用需求越来越大,如何有效提高视频编码效率和性能,一直是视频编码领域研究的热点。其中一个关键的问题就是在码率受限的情况下,如何优化码率控制算法,使得在不发生缓冲区溢出的条件下,尽可能的使比特数得到合理的分配。而在评价视频编码算法性能的时候,不能只看失真大小或是输出码率大小。一般需要结合输出码率和编码失真一起考虑。从另一方面来看,就是在同等失真(视频质量)下,输出码流码率越低,编码算法效率也越高。从本质上讲,就是在给定的失真约束下,如何合理采取各种技术对信源以最小码率进行描述的问题;或是在一定输出码率约束下,如何尽可能减小失真,提高视频质量的问题。
现存的视频编码算法大多采用率失真优化来去除视频的统计冗余信息,而算法中评价视频编码失真的准则通常为均方误差(MSE)和峰值信噪比(PSNR)。该评价准则并不和人眼视觉系统(HumanVideoSystem,HVS)对于视频的评价完全一致,因此该类视频编码算法存在不能去除生理/心理信息冗余的缺陷,而人眼是最终的信息接收者,信噪比高的帧并不一定有最佳的主观视觉质量。
为了利用相同的、甚至更少的比特数获得更佳的主观视觉质量,本文的主要贡献有:
1.建立了一种基于人眼视觉系统的感知模型,将反映视觉感知系统某部分特征的宏观描述统一到一个整体的数学模型中,特别是将人眼对于运动信息的感知特性与频率特性等其他信息相融合;
2.在分析JVT-G012算法的优点与不足之后,建立了一种基于感知模型的自适应码率控制算法,该算法利用感知模型分析当前编码帧的复杂度与编码单元的视觉关注度之后,对帧级比特数进行二次分配和对基本单元层量化参数调整;
3.建立了一种新的感知MAD预测模型和感知基本单元比特数预测算法来取代JVT-G012中原有的算法,该算法将宏块MAD的预测与比特数的分配与人眼联系在了一起,不仅客观上PSNR增加,主观的视觉质量也得到极大的提高;
4.针对场景切换产生的码率突变导致视觉质量突变问题提出了一种预警装置。