论文部分内容阅读
在多媒体时代,视频是包含信息量最大、最直观的一种信息传播媒介。然而,由于数字视频数据量巨大,必须经过压缩编码才能实现视频的传输、存储和播放。视频压缩编码技术一直是多媒体领域的研究热点之一。 随着人们对视频质量的要求不断提高,视频编码标准也在不断的发展。从早期的H.261、MPEG-1和MPEG-2到后来的MPEG-4和H.263,再到目前应用最广泛的H.264/AVC以及最新的HEVC,视频编码标准的压缩效率越来越高,但同时编码计算复杂度也在成倍地急剧升高,严重地阻碍了视频应用,尤其是实时视频应用。因此研究快速视频编码有十分重要的理论和实际意义。 视频编码的主要计算是编码模式选择,因此研究快速视频编码的核心问题是研究快速模式选择。本文分别从两个角度对快速模式选择进行了研究:1)并行计算,即将复杂的模式选择过程进行计算任务分解,然后使用多核或众核处理对这些分解后的任务进行并行处理以达到加速的目的。本文研究面向众核平台的高并行度模式选择算法;2)精简模式,即在模式选择过程中,根据某些先验信息选择性地忽略某些编码模式以缩小模式搜索空间来达到加速的目的。本文研究在视频转码环境下,使用输入的原始码流中包含的模式信息来指导加速后续的编码模式选择。 以HEVC和H.264为研究对象,本文的主要研究内容及创新点如下: 1.基于MER的多层次细粒度并行HEVC帧间模式选择 HEVC作为目前最新编码标准,其帧间模式选择计算量很大,是编码器的速度瓶颈,本文研究用并行计算的方法来加快此过程。基于HEVC对并行运动估计的支持特性MER(Motion Estimation Region),本文提出了一种以MER为并行范围的多层次细粒度数据级并行帧间模式选择算法。本文深入分析了在一个MER内相邻CU、PU在帧间模式选择过程中的数据依赖关系,主要包括运动矢量依赖、概率模型继承依赖和概率建模依赖,并且分别设计了相应的依赖关系消除算法,使得在同一个MER内所有的CU以及所有的PU都可以并行地进行模式选择计算。本文将算法在TILE64众核平台上进行了实现,获得了平均15倍的加速比且编码质量损失较小(平均码率上升1.79%)。 2.基于任务划分的多层次细粒度并行HEVC帧内模式选择 由于采用了灵活的编码结构和预测模式,HEVC帧内模式选择计算复杂度也很高。随着HEVC帧间模式选择的并行化,帧内模式选择逐渐成为了新的速度瓶颈,同样需要加速。本文提出了一种以CTU为并行范围的多层次细粒度数据级并行HEVC帧内模式选择算法。本文对帧内模式选择过程进行了子任务类型划分,分析了相邻CU、PU、TU在帧内模式选择过程中的数据依赖关系,主要包括帧内预测重构像素依赖、帧内预测模式编码依赖、概率模型继承依赖和概率建模依赖,并分别提出了有效的依赖性消除算法;对于每个子任务类型,在整个CTU范围内对所有的CU、PU或TU都可以并行处理。本文将算法在TILE-Gx36众核平台上进行了实现,获得了平均18倍的加速比且质量损失较小(平均码率上升3.04%)。 3.基于分类器的快速H.264/AVC帧内模式选择 H.264作为目前应用最广泛的标准,其帧内模式选择计算复杂度很高,本文研究用精简模式的方法加速此过程。本文研究在HEVC到H.264转码的环境下使用输入的HEVC码流包含的HEVC模式信息来指导加速H.264帧内模式选择。本文将H.264帧内模式选择过程分成两个阶段进行:第一阶段进行宏块划分模式的快速选择,第二阶段进行子块预测模式的快速选择。在第一阶段,将宏块划分模式选择问题建模成分类问题,从HEVC码流中提取相关信息构造当前宏块的复杂度特征向量,使用离线训练好的分类器对特征向量进行分类,根据分类结果忽略掉相应的划分模式,减小了计算量。在第二阶段,根据HEVC码流中包含的HEVC帧内预测模式信息估计当前子块的纹理主方向,在选择H.264帧内预测模式时只需要计算主方向附近的模式,缩小了的搜索范围。实验结果表明本文提出的算法平均能节省67.98%的转码时间且编码质量损失较小(平均码率上升2.32%)。