视频编码中快速模式选择算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jiaoxuepan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多媒体时代,视频是包含信息量最大、最直观的一种信息传播媒介。然而,由于数字视频数据量巨大,必须经过压缩编码才能实现视频的传输、存储和播放。视频压缩编码技术一直是多媒体领域的研究热点之一。  随着人们对视频质量的要求不断提高,视频编码标准也在不断的发展。从早期的H.261、MPEG-1和MPEG-2到后来的MPEG-4和H.263,再到目前应用最广泛的H.264/AVC以及最新的HEVC,视频编码标准的压缩效率越来越高,但同时编码计算复杂度也在成倍地急剧升高,严重地阻碍了视频应用,尤其是实时视频应用。因此研究快速视频编码有十分重要的理论和实际意义。  视频编码的主要计算是编码模式选择,因此研究快速视频编码的核心问题是研究快速模式选择。本文分别从两个角度对快速模式选择进行了研究:1)并行计算,即将复杂的模式选择过程进行计算任务分解,然后使用多核或众核处理对这些分解后的任务进行并行处理以达到加速的目的。本文研究面向众核平台的高并行度模式选择算法;2)精简模式,即在模式选择过程中,根据某些先验信息选择性地忽略某些编码模式以缩小模式搜索空间来达到加速的目的。本文研究在视频转码环境下,使用输入的原始码流中包含的模式信息来指导加速后续的编码模式选择。  以HEVC和H.264为研究对象,本文的主要研究内容及创新点如下:  1.基于MER的多层次细粒度并行HEVC帧间模式选择  HEVC作为目前最新编码标准,其帧间模式选择计算量很大,是编码器的速度瓶颈,本文研究用并行计算的方法来加快此过程。基于HEVC对并行运动估计的支持特性MER(Motion Estimation Region),本文提出了一种以MER为并行范围的多层次细粒度数据级并行帧间模式选择算法。本文深入分析了在一个MER内相邻CU、PU在帧间模式选择过程中的数据依赖关系,主要包括运动矢量依赖、概率模型继承依赖和概率建模依赖,并且分别设计了相应的依赖关系消除算法,使得在同一个MER内所有的CU以及所有的PU都可以并行地进行模式选择计算。本文将算法在TILE64众核平台上进行了实现,获得了平均15倍的加速比且编码质量损失较小(平均码率上升1.79%)。  2.基于任务划分的多层次细粒度并行HEVC帧内模式选择  由于采用了灵活的编码结构和预测模式,HEVC帧内模式选择计算复杂度也很高。随着HEVC帧间模式选择的并行化,帧内模式选择逐渐成为了新的速度瓶颈,同样需要加速。本文提出了一种以CTU为并行范围的多层次细粒度数据级并行HEVC帧内模式选择算法。本文对帧内模式选择过程进行了子任务类型划分,分析了相邻CU、PU、TU在帧内模式选择过程中的数据依赖关系,主要包括帧内预测重构像素依赖、帧内预测模式编码依赖、概率模型继承依赖和概率建模依赖,并分别提出了有效的依赖性消除算法;对于每个子任务类型,在整个CTU范围内对所有的CU、PU或TU都可以并行处理。本文将算法在TILE-Gx36众核平台上进行了实现,获得了平均18倍的加速比且质量损失较小(平均码率上升3.04%)。  3.基于分类器的快速H.264/AVC帧内模式选择  H.264作为目前应用最广泛的标准,其帧内模式选择计算复杂度很高,本文研究用精简模式的方法加速此过程。本文研究在HEVC到H.264转码的环境下使用输入的HEVC码流包含的HEVC模式信息来指导加速H.264帧内模式选择。本文将H.264帧内模式选择过程分成两个阶段进行:第一阶段进行宏块划分模式的快速选择,第二阶段进行子块预测模式的快速选择。在第一阶段,将宏块划分模式选择问题建模成分类问题,从HEVC码流中提取相关信息构造当前宏块的复杂度特征向量,使用离线训练好的分类器对特征向量进行分类,根据分类结果忽略掉相应的划分模式,减小了计算量。在第二阶段,根据HEVC码流中包含的HEVC帧内预测模式信息估计当前子块的纹理主方向,在选择H.264帧内预测模式时只需要计算主方向附近的模式,缩小了的搜索范围。实验结果表明本文提出的算法平均能节省67.98%的转码时间且编码质量损失较小(平均码率上升2.32%)。
其他文献
随着Web2.0的发展,微博、社交网站、博客等社交类网络应用已融人人们社会生活的方方面面。社交网络的一个突出特点是个体间相对静态的网络结构和具有动态性、时效性的个体信息
机群数据库系统成为大容量数据处理密集系统的有效载体,其应用范围越来越广、系统规模越来越大。本文以国家网络安全监测系统中对大规模机群数据库系统的需求出发,总结了其对机
随着Internet的飞速发展,Web上的网页数据量成几何级数的增长。为了更快更准确的找到最需要的信息,人们越来越依赖于搜索引擎系统。尽管各大搜索网站不断的改进搜索引擎技术,但
学位
随着支持SIP协议的众多服务器和终端产品的相继推出,全面评测这些产品的性能成为目前亟待解决的问题。在此背景下,作者对SIP协议测试方法和测试工具进行了深入的研究并已取得
随着软件规模的日益增大,软件变得越来越复杂。各种软件安全缺陷引起了严重的安全问题,甚至造成资源的重大损失。为了降低这种风险和损失,软件开发人员在实施软件工程的过程中采
学位
骨架是图像几何形态的一种重要拓扑描述。随着MRI,CT及其它3D重建技术的发展,3D图像数据应用越来越广泛。3D骨架在图像数据的压缩,物体识别与表面重建,3D植物建模及植物根系图像
机器翻译是自然语言处理中的一个重要研究方向。近年来,统计机器翻译取得了很大的成功,基于短语的翻译系统在机器翻译评测中占据了主要地位,并且取得了领先的成绩。最大熵模型可
当今已经成为社会信息化的基础平台,它是各种网络资源的互联。我国目前所处的网络环境的特点是机遇与挑战并存。一方面,互联网在我国处在快速发展阶段;另一方面,我国在互联网发展
学位
中国地质大学校园网规模不断扩大,原有的网络管理方式已不能满足发展的需要,如何保证网络快速,安全,稳定地运行已成为目前最主要的任务。本文利用SNMP协议,采用B/S开发模式,开发了
学位
当前,多核/众核体系结构已经成为主流架构。然而,多核/众核平台的实际性能与其拥有的资源并不完全匹配,平台可扩展性较差。如何充分利用多核/众核平台上丰富的计算资源成为学术