论文部分内容阅读
在计算机技术以及网络通信技术,特别是移动计算和移动通信技术飞速发展的背景下,视频应用正在以前所未有的速度迅猛增长。同时,视频应用中网络和终端多样化的特点也呈现地愈发明显。网络视频点播、高清电视直播、视频电话、视频会议、视频监控等基于视频的应用形式正在广泛而深远地影响着人们的工作和生活。作为视频技术能够得到广泛应用的一个必要条件,视频编码的标准化已经经历了数十年的发展历程,产生了一系列的视频编码标准。从早期的H.261、H.262/MPEG-2、H.263等等到目前主流的H.264/AVC,以及最新的HEVC等。每一代视频编码标准都提供了一系列的编码工具,视频应用开发者可以自由地利用编码标准所提供的编码工具产生符合标准的码流,而编码标准对于编码工具的定义也在很大程度上决定了采用该编码标准所能达到的编码性能。目前主流的视频编码标准均采用了基于预测、变换、量化、熵编码的混合编码框架。其中,帧间预测是编码器挖掘视频信号的时间相关性的主要手段。帧间预测技术对视频应用有两个方面的影响:首先,帧间预测的效率对编码的整体效率有很大的影响,帧间预测的效率涉及预测信号的精度和预测信号所需的运动信息开销两个方面,预测信号越精确、运动信息开销越小,则预测的效率越高;其次,帧间预测导致帧与帧之间的数据依赖,这种依赖制约了码流的适配能力,而视频编码标准中对码流适配的支持(如实现随机接入、码流的时间可伸缩等)通常对应着某种程度上对参考关系的切断。在标准和应用层面需要合理地定义和配置编码的参考关系,以达到编码效率和码流适配能力的平衡。本文面向当前主流的视频编码标准,以帧间预测技术为主要研究内容,从预测信息的编码效率和码流适配能力两个方面对现有的帧间预测编码方法进行了研究。一方面针对基于运动矢量竞争的运动信息编码方法进行了改进,降低了码流中描述预测信号所需的数据开销,进而提升了帧间的整体编码效率;另一方面深入研究了感兴趣区域可伸缩编码场景下的帧间预测数据依赖问题,在标准兼容的基础上提供了感兴趣区域可伸缩及可重写的高效编码方法。本文的主要工作及创新点如下:1.面向基于运动矢量竞争的运动信息编码技术,提出了基于区域划分准则的运动矢量编码方法。该方法使用基于欧氏距离的区域划分准则进行运动矢量预测选择,以便对运动搜索的备选搜索点集合按照区域划分的方式进行分类处理。对属于特定类别的运动矢量在解码通过直接推导的方式获得编码端的竞争矢量选择信息;而对其他分类的运动矢量,利用数据隐藏的方法将竞争矢量的选择隐藏在运动矢量残差的奇偶性当中,通过在KTA及TMuC参考软件平台进行实验仿真,证明了该方法在编码效率上显著优于传统的竞争矢量编码方法。2.面向H.264/SVC的可重写SVC编码技术,提出了空间及感兴趣区域可重写的SVC编码方法。感兴趣区域可重写及空间增强层的可重写特性对提升H.264/SVC码流向H.264/AVC用户提供兼容服务的能力有重要意义。针对H.264/SVC不支持空间可重写的缺点,本文方法利用变换域的帧间残差上采样技术克服了空间增强层层问残差预测计算量大的问题,实现了空间增强层可重写编码。同时,针对H.264/SVC中感兴趣区域编码场景下感兴趣区域边缘非整像素对背景区域数据依赖的问题,本文采用了基于率失真优化准则的解决方法,在支持感兴趣区域可重写特性的前提下,取得了标准兼容性、压缩效率、以及解码漂移这三者之间的良好平衡,同时,针对仍然存在的解码漂移,利用关键帧技术控制可能产生的错误传播,进一步提高了总体编码效率。通过在JSVM参考软件平台进行实验仿真,证明该方法在保留感兴趣区域可重写特性的同时显著提升了编码效率。3.面向H.264/SVC增强层感兴趣区域编码,提出了基于辅助编码环路的SVC增强层感兴趣区域编码方法。该方法在增强层感兴趣区域进行单独解码时,利用基本层信息生成背景区域的近似信号用作参考,并在编码端维护了与感兴趣区域单独解码场景相对应的辅助编码环路。在该编码环路中,利用基本层信息,通过错误隐藏的方法生成参考信号(虚拟参考帧)的背景区域,而感兴趣区域则以虚拟参考帧为参考进行重建。编码的模式选择过程综合考虑两种解码场景下的率失真代价进行。在增强层完整解码时,解码环路与编码端的主编码环路相同步,而感兴趣区域单独解码时解码环路与辅助编码环路相同步。由上述过程生成的码流与H.264/SVC标准兼容,在支持感兴趣区域可伸缩编码的同时保证了编码效率、避免了错误传播的影响。论文在JSVM平台上与现有方法进行了对比仿真,实验结果表明该方法在感兴趣区域可伸缩的场景得到了优于现有方法的编码性能。