可分级视频编码中运动估计技术研究与优化

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cool_king_wq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可分级视频编码(SVC)作为H.264/AVC的可分级扩展,是正在制订中的视频编码标准。它通过时域层、空域层和质量(SNR)层的混合可分级的机制,在比特流级上实现可分级性,同时具有很好的压缩效率。它能够简单灵活地适应传输网络异构,特别是带宽动态变化和错误产生等多种不利因素。但是,采用率失真优化全遍历策略对不同分块进行运动估计来选取最优模式,极大增加了编码器的计算复杂度,严重阻止了SVC的实际应用。因此,在保持SVC编码效率的同时降低其计算复杂度成为我们要解决的问题。首先,本文介绍了可分级视频编码技术及其在H.264可分级扩展中的应用;接着介绍了H.264的运动估计(ME)技术,其中包括运动估计原理、宏块划分、模式决策、率失真优化和搜索算法;以及评价视频质量的标准。其次,本文分别统计分析了空间可分级和精细质量可分级基本层与增强层之间的模式分布相关,根据其相关性分布规律设计了层间快速模式决策算法,很好地降低了SVC的时间复杂度。实验结果表明,与SVC参考软件相比,在PSNR平均仅降低0.04dB、码率平均减少0.096%的前提下,该优化算法能使运动估计编码速度平均提高50%以上。然后,本文分析了视频序列的分布特性,根据空域周围宏块、时域对应宏块与当前宏块的模式分布关系,以及时域对应宏块与当前宏块的运动相关,对当前宏块最有可能的最优模式进行预决策。模式预决策快速算法只搜索预决策产生的模式子集,简化了模式选择过程。相对于SVC参考软件,本算法在PSNR平均降低小于0.04dB、比特率平均减少0.5%的前提下,平均节约56.73%的编码时间。最后,本文根据视频序列中一个对象中多个宏块间的运动相关,提出运动能量和运动一致性的概念,通过得到的运动信息做为判断依据,设计出自适应整/亚像素搜索算法。该算法在图像质量基本保持不变的情况下有效地降低了编码复杂度,具有一定的研究应用价值。
其他文献
数据仓库中的数据大多来源于多个分散、异构及自治的底层业务数据库,其信息以实视图的形式存储。通过物理上的预先存储,加快了查询响应时间,大大提高了数据仓库的性能。然而,底层
CT图像重建是图像处理的一个重要分支,它既包含数学理论基础研究,又涉及实际的应用领域。近年来,CT图像重建在医学诊断、工业无损检测、农林业、地球物理和环境保护等领域都
随着网络的复杂性不断提高,网络安全也越来越受到关注,为更全面的保护网络不受攻击,需要能及时发现恶意行为,并在这种行为对系统或数据造成破坏之前采取措施,入侵检测系统应运而生
随着计算机系统应用到航天、军事、工业等高可信性领域,人们对计算机系统在软件和硬件方面的可信性要求也大大提高。网络的出现和发展使得计算机系统失效带来的影响和损失更
工程设计人员每天有很多时间花费在对所需图档的查阅上,因此如何快速、准确地从图档库中检索出所需的图档对其而言非常重要。现有的图档管理系统一般根据项目、设计人、日期
随着汽车电子的迅速发展,车内的电子控制系统由传统的集中式控制逐渐被分布式控制所取代。CAN(Control Area Network)以其高可靠性、无破坏仲裁、多主等优越特性,成为了车内
虚拟人(virtual human或computer synthesized characters)是人在计算机生成的空间(虚拟环境)中的几何特性与行为特性的表示。要实现人在三维虚拟环境中的准确再现,不仅要模拟
三维人脸重建是计算机视觉的核心研究内容之一,它涉及的内容包括三维人脸识别、三维人脸动画、3D游戏仿真、虚拟现实等方面的应用。随着一大批人脸重建算法的涌现,近年来,三维人
随着互联网的广泛应用,互联网上出现了大量的垃圾信息以及各种网络攻击。要想营造一个健康和安全的网络环境,一个重要的手段就是对互联网信息进行分析过滤。过滤垃圾信息和入侵
Linux具有功能强大、开放源码、支持多种硬件平台、模块化设计等优点,在嵌入式领域得到了广泛的应用。但同时Linux是一个分时操作系统,其不可抢占的内核、粗糙的时钟粒度、频繁