论文部分内容阅读
随着网络技术和视频编码技术的飞速发展,通过网络获取视频信息在人们的日常生活中越发不可获缺,如何在异构的网络环境下同时对各个终端用户提供个性化服务是网络化视频应用面临的新挑战。可伸缩视频编码作为解决这一难题的有力工具受到了广泛关注,是视频编码领域的研究热点。可伸缩视频编码提供了具有帧率、分辨率和质量可伸缩的视频流,从而视频服务器端或接收端可以根据网络带宽、终端设备的屏幕大小、处理能力等因素,灵活提取视频流。与传统非可伸缩视频编码相比,可伸缩视频编码的计算复杂度随编码层数的增加而增大,而且由于使用了层间预测编码技术,其单层编码的计算复杂度也相应增加。因此,研究如何充分利用可伸缩视频编码的新特点,降低可伸缩视频编码的计算复杂度对可伸缩视频编码的实际应用具有重要意义。其次,在可伸缩视频编码中,解码端对提取得到的部分码流进行解码重建,解码端获得的视频质量与编码端获得的视频质量存在差异。考虑到人是视频信息的最终接收者,而视频信息通过解码显示得到,所以需要尽可能提高解码端的视频质量。由于编码算法对视频质量起着重要作用,同时码流提取算法对视频质量也有很大影响,所以,如何在编码过程和码流抽取过程中优化质量是可伸缩视频编码研究的重要问题。本文正是在这种背景下,开展了可伸缩视频编码快速算法和质量优化方法的研究,具有重要的理论意义和应用价值。第一章绪论部分首先阐述了本文选题的意义,总结了国内外的研究状况,最后介绍了本论文的研究内容和章节安排。第二章主要概述了可伸缩视频编码标准的技术要点,为后续章节的研究内容提供了必要的背景知识。第三章提出了一种基于率失真代价相关性和运动相关性的层间预测选择快速算法,包括层间运动预测选择快速算法和层间残差预测选择快速算法。为了快速选择层间运动预测,首先利用BLSKIP模式和Direct模式的率失真代价分别作为宏块级的层间运动相关性和空间运动相关性的度量,然后,进行不使用层间运动预测的运动搜索,获得运动矢量,计算该运动矢量和两种预测矢量之间的距离,分别作为子块级的层间运动相关性和空间运动相关性的度量。最后结合宏块级和子块级的运动相关性快速选择层间运动预测。针对层间残差预测快速选择,在使用层间残差预测的情况下进行运动搜索和运动补偿,得到残差数据块,然后利用残差数据块分别估计使用和不使用层间残差预测情况下的率失真代价值,根据率失真代价的比值进行层间残差预测快速选择。层间预测选择快速算法的一个优势是可以与已有的模式选择快速算法相结合,进一步降低复杂度。第四章针对可伸缩视频编码模式选择计算量过大的问题,提出了一种基于提早退出的模式选择快速算法。该算法首先对出现概率大且运算量小的SKIP模式和BLSKIP模式进行优先搜索,然后根据基本层宏块模式预测出作为判断基准的模式,当满足局部最优和率失真代价单调性条件时,提早结束本次模式搜索。对于不满足提早退出条件的情况,利用层间模式相关性除去不适用的候选模式,再结合上一个步骤中已经获得的模式搜索结果动态调整候选模式,然后进行改进搜索,得到宏块最佳模式。第五章针对现有方法单纯依靠码流提取算法对视频质量进行优化的问题,提出了一种可伸缩视频编码质量优化方法,包括基于部分重建的编码质量优化方法和基于混合率失真的码流提取算法,分别从编码过程和码流提取过程进行质量优化。首先,在编码过程中,对增强层上的残差变换系数进行截断,利用剩余的残差变换系数进行重建和熵编码,计算得到基于部分重建的率失真代价。通过残差变换系数的截断和重建实现了对增强层码流部分丢弃的仿真。然后,使用基于部分重建的率失真代价参与基本层宏块和增强层宏块的模式选择。在码流抽取过程中,首先计算每个NAL单元的率-失真,然后,在同一访问单元内,按照质量层由低到高的顺序,依次计算从当前质量层到最高质量层内所有NAL单元的率-失真和,作为当前NAL单元的混合率-失真。最后根据每个NAL单元的混合率-失真的斜率作为排序因子进行优化级分配。第六章总结了本论文的研究成果和创新点,对进一步研究的方向和任务进行了展望。