H.264标准下的快速运动估计算法的研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:caiql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运动估计是视频压缩中普遍采用的一项技术,它已经被广泛运用到了当今的国际视频压缩标准中。它是去除视频数据中的时间冗余度的有效方法,运动估计的性能直接影响到编码的效率和恢复图像的质量。然而,运动估计的计算复杂度比较高,基于运动估计的编码器的计算量主要集中在运动估计上。特别是在H.264编码器中,由于高精度运动矢量,以及可变块大小的运动估计被采用,计算量迅速增长,运动估计消耗整个视频编码的时间在70%以上。运动估计成为了视频压缩的瓶颈,因此,高效快速的运动估计算法成为视频压缩领域的研究热点。本文在H.264/AVC的技术特点和现有运动估计算法的深入研究的基础上,从块匹配和模式选择这两大关键技术上着手,提出了以下三种快速算法:(1) H.264/AVC中基于多模板搜索的快速运动估计算法。该算法首先将当前块划分为准静止块,小运动块和大运动块,然后根据判别的运动块类型相应地选择搜索模板和搜索策略。(2)基于H.264/AVC的多方向自适应运动估计。该算法根据运动类型自适应地选择搜索策略,并结合垂直方向,水平方向,对角线方向,反对角线方向的十字形模板进行多方向自适应搜索。(3)基于H.264的高效帧间预测模式选择。该算法提出了根据时间和空间的相关性,以及对平均绝对差值(SAD)的计算,来把SAD和事先设定的阈值进行比较,以通过提前确定当前的最优的模式为16×16的模式的方法来降低计算复杂度。同时该算法还根据7种模式之间的相关性,以及各个模式的概率的实验统计结果而提出新的判定准则,有效地过滤一些小概率模式,以提前确定当前宏块的模式来降低计算复杂度。实验结果表明,本文提出的三个算法在图象质量基本保持不变的情况下,极大地提高了编码速度。
其他文献
人脸动画是广泛应用于计算机动画行业、游戏行业、远程会议、代理和化身等许多领域,是近几年来国内外研究的热点。其中,基于单幅图像的人脸动画的研究近年来引起了许多研究者
随着万维网技术和数据库技术的结合,网络开始迅速的深化。大量的信息都隐藏在Web数据库中,用户通过查询可以动态的获取这些信息,学者们将这类资源称为Deep Web。由于Deep Web
公共仓库元模型(Common Warehouse Metamodel,CWM)是对象管理组织(Object Management Group,OMG)为数据仓库和业务分析领域中使用的元数据制定的一个互操作标准,已经成为模型
森林环境的改变过程是不可逆转的,林业管理者一旦做出管理决策并给予实施,将对森林今后的生长和经营起着决定的作用,因此林业管理者迫切需要引入能够对林业信息进行准确、可
无线传感网络是一种新型的可实时监测和传输信息的网络,具有巨大的潜在应用价值,已经引起人们的重视与研究。无线传感网络已经在许多应用领域中展现出特有的优势,但是也暴露出了
无线射频识别(RFID)标签所有权是指标签的所有者(合法阅读器或数据库)能正常行使标签的各个功能,如获取标签内部信息,重新对标签内信息进行更改和写入,或是将对标签的所有权
李群机器学习(LML)既继承了流形学习的优点,又充分利用了李群的代数结构和几何结构的数学本质,自提出以来就引起了许多研究者的关注。本文是在李群机器学习的理论框架上,以李
伴随着互联网而生的在线广告,在过去几十年里,得到飞速发展。广告点击率作为计算广告的重要研究内容,越来越受到人们的关注。借助机器学习,根据历史数据预估广告点击率是目前的主要方法,凭借准确的广告点击率预估可以使广告投放得更加精准,提高真实的点击率,增加收益。虽然使用线性模型可以简单地预估广告点击率,但是线性模型的学习能力有限,对于越来越多的数据特征,无法更有效得学习,而且在学习的过程中容易出现过度拟合
网格计算是当今计算机科学领域最新兴起的一项有很高学术价值和应用价值的研究课题。网格计算由于自身系统的庞大性涉及了很多方面的关键技术,如:资源描述与发现、资源管理与
随着软件应用领域的不断发展,软件测试作为一种保证软件质量的有效方法已经得到了广泛的重视。而面向对象技术的迅速发展,对软件测试技术又提出了新的要求,并使得研究面向对