基于X264的运动估计算法研究

来源 :硅谷 | 被引量 : 0次 | 上传用户:yuyisea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]H.264是目前最新的视频编解码标准,研究运动估计基本原理和研究状况的基础上,对X264编码器的三种运动估计算法进行分析和比较,实验结果表明可以在保证图像质量的情况下,提高编码速度,有效压缩视频。
  [关键词]H.264 视频编码 运动估计 X264
  中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)1220108-01
  
  一、运动估计基本原理和研究现状
  
  运动估计算法非常多样,大体上可以分为四类:递归估计算法[3],光流法[4],贝叶斯估计算法[5],块匹配算法[6]。其中块匹配运动估计算法因具有算法简单、便于VLSI实现等优点得到广泛应用。
  
  二、X264中运动估计算法
  
  X264利用相邻块的运动信息选择初始搜索点。由于编码过程中宏块按扫描顺序编码,同一帧图像中与当前块相邻的已编码块共有上、左、左上、右上4个块。在参考帧中,以这四个相邻已编码块的最佳匹配位置,以及当前块的相同位置(运动矢量为(0,0)的位置)为候选点,选择其中最匹配的位置作为运动估计的初始搜索点。
  然后以初始搜索点为中心,进行整像素搜索,1/2像素精度搜索以及1/4像素精度搜索,具体过程如图1。以大写英文字母标注整像素位置,以小写英文字母标注1/2像素位置,以阿拉伯数字标注1/4像素位置。首先,在整像素运动估计中,假设点E为最佳匹配点,则编码器在其周围的八个1/2像素位置(a-h)行搜索,设b为这一阶段的最佳匹配点,则在b周围的8个1/4像素位置(1~8)中进行搜索,直至找出最佳的1/4像素精度的匹配位置。
  X264中提供了三种可选的整像素的运动估计算法:X264_ME_ESA,X264_ME_HEX和X264_ME_DIA。X264进行整像素搜索的时候,首先是进行一个粗略的搜索,找到一个初步匹配的点,然后以此点为搜索中心,从上述三种搜索算法中选择一种进行搜索,最终得到最匹配的整像素匹配点。
  1.X264_ME_ESA是一种全搜索算法,它对搜索区域的内的点进行全搜索,SAD最小的点就是全局的最优搜索点。
  2.X264_ME_DIA是一种小菱形搜索算法,它的搜索过程如图2(b):
  (1)对搜索区域内的点以小菱形模板(如图2(a))进行搜索,即对菱形顶点和中心点在内的5个黑点进行搜索,如果SAD最小的点在菱形的中心,则这个点就是整个搜索域内的最优匹配点,搜索结束,否则转入(2);
  (2)以上述菱形顶点上SAD最小的点为中心,重复(1)。
  (3)X264_ME_HEX是一种基于六边形的格点搜索算法,有大小两种模板,它的搜索过程可以分为两步:
  ①首先对搜索区域内的点以模板进行一个六边形的搜索,如图3(a)所示,即对圆形的黑点进行搜索。如果这7个点的最匹配点位于六边形的中心,则转入②,否则以六边形边上SAD最小的点为中心,重复①。注意,除了第一步外,其余步都不需要对中心点周围的六个点都进行搜索,如图中第二步,由于中心点周围点中有三个点在第一步已经被检索过,所以这一步只需要计算其他三个点的SAD值。
  ②对以①中搜索到的匹配点为中心的正方形区域(模板如图3(b))的点进行搜索,即对8个正方形的黑点进行搜索,则这9个点(正方形中域中的8个点和中心的一个点)中SAD最小的点就是整个搜索域的最匹配点。
  
  三、X264三种运动估计算法性能比较与分析
  
  我们分别对foreman.qcif,carphone.qcif和claire.qcif三个序列进行了测试,测试环境为Pentium(R)4的CPU,1.8GHz,256MB内存,测试结果如表1:
  


  从测试结果看,总体上来说,X264_ME_ESA算法的峰值信噪比最高,X264_ME_HEX的峰值信噪比次之,X264_ME_DIA算法的峰值信噪比最低,这是由于他们三者的搜索准确度递降的缘故。而这三种算法的计算量也由X264_ME_ESA到X264_ME_HEX至X264_ME_DIA成依次减少的趋势,X264_ME_HEX和X264_ME_DIA较X264_ME_ESA,速度上有明显的优势。
  
  参考文献:
  [1]ITU Telecom.Standardization Sector of ITU,Advanced video coding for generic audiovisual services.ITU-T Recommendation H.264,2005(3).
  [2]http://www.videolan.org/developers/x264.html.
  [3]Looijenga L Biemond J,Boekee D E et al,A pelrecursive wiener-baed displacement estimation algorithm,Sign Proc,pp,13:399~412,1987.
  [4]Nandhakumar N Aggarawal J K,On the computation of motion from sequences of images,Proc IEEE,pp,76:917~935,1988.
  [5]Heitz F.Bouthemy P,Motion estimation and segmentation using a global Bayesian approach, Proc Int Conf ASSP Albuquerque NM,pp,2305~2308,1990.
  [6]Bierling M,Displacement estimation by hirarchical blockmatching,Proc Visual Comm and Image Proc SPIE,pp,1001:942~951,1988.
其他文献
[摘要]为方便快捷的对人员进行沟通,通过Jmail邮件发送功能和139信箱本身的手机提示功能,实现快捷的信息提醒。主要阐述实现本功能的ASP源码的编写,希望对计算机爱好者一些启发。  [关键词]Jmail 139信箱 手机提醒  中图分类号:TN92 文献标识码:A 文章编号:1671-7597(2008)1220080-01    在单位中,有时会通知员工参加会议或报送材料,给每个人打电话显得尤
期刊
[摘要]研究一个客户登录系统的实现,该系统是在visual studio.net2005下使用c#语言、SQL server2000数据库进行开发。首先介绍系统的开发背景以及研究价值,其次,介绍开发环境、语言及数据库,最后,叙述系统设计的实现。  [关键词]NHibernate 对象/关系映射 登录   中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)1220065-0
期刊
[摘要]ASP.NET 2.0引入了一系列可以改善数据访问的新工具,包括几个数据源和数据绑定控件。新增种类的数据源控件可以消除 ASP.NET 1.x中要求的大量重复性代码,可以很容易地将 SQL语句或存储过程与数据源控件相关联,并且将它们绑定到数据绑定控件。介绍ASP.NET 2.0中先进的数据源控件和数据绑定控件。  [关键词]ADO.NET 数据源控件 数据绑定控件  中图分类号:TP3 文
期刊
[摘要]简要介绍Cookie特性及应用现状。重点讨论Cooke的安全性问题,提出集中防范Cookie泄密的安全措施。  [关键词]Cookie 信息安全 服务器  中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)1220078-01    几乎所有的网站设计者都使用了Cookie技术。有些网站和机构滥用Cookie,未经访问者的许可就搜集用户的个人资料,以谋求商业利益。
期刊
中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)1220014-01    一、用USB接口捕获DV视频的背景    二十一世纪的今天,家庭用的DV机(数码摄像机)已经非常普及,一般的DV所使用的存贮介质是磁带,也有一些DV同时配有存贮卡,但这种存贮卡一般是留作存贮图片的(针对同时具有摄像和照相功能的DV),单纯用存贮卡作为视频存贮的DV机目前价格较高,大众接受及使用率
期刊
[摘要]以开发教学质量评估系统为背景,重点阐述关联规则中的Apriori算法在评估系统中的运用,并以实例说明。  [关键词]评估系统 Apriori算法 关联规则  中图分类号:TP3文献标识码:A 文章编号:1671-7597(2008)1220076-01    一、引言    高校教学质量评价系统的建立其目的不是简简单单地给教师一个评价等级,而是根据评价结果向教师传达重要的教学信息,帮助他们
期刊
[摘要]基于ASP.NET平台的网站和应用越来越广泛,用户对网站的访问速度的要求也越来越高。网站的访问速度取决于很多因素,主要从网站的系统架构和性能优化两方面入手,结合实际经验,提出一些最佳技术实践和解决方案。  [关键词]ASP.NET 网站架构 性能优化  中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)1220069-01    随着互联网的发展,新技术层出不穷,
期刊
[摘要]虚拟用户交换机(Centrex)拥有用户专用交换机(PBX)的部分功能,在小型公司、企业、酒店、宾馆得到了广泛的应用,从中大型星级酒店的通信需求和通信安全出发,从四大方面描述Centren与PBX星级酒店组网时各自的优劣之处,以期达到了解两者适用条件的目的。  [关键词]Centrex PBX 星级酒店  中图分类号:TN91 文献标识码:A 文章编号:1671-7597(2008)122
期刊
[摘要]绩效考评系统根据银行历史情况,根据一定的标准,为相决策者在做出某种决策时提供决策分析,变“事后控制”为事前控制。对商业银行绩效考评系统应该解决的问题以及所应遵循的设计原则进行分析,并对该系统进行设计。  [关键词]绩效考评 设计 功能模块  中图分类号:F83 文献标识码:A 文章编号:1671-7597(2008)1220119-02    目前,中国存在许多家银行,银行间竞争激烈。银行
期刊
[摘要]根据对我国农村建筑物样本的调查结果,总结农村房屋的抗震特征,分析建筑物的建造年代、结构类型、抗震处理。提出提高农村房屋抗震能力的对策和建议。  [关键词]农村房屋 抗震特征 抗震对策  中图分类号:P5 文献标识码:A 文章编号:1671-7597(2008)1220089-02    一、前言    2008年5月12日14时28分,在四川汶川县发生M8.0级地震,造成69181人遇难,
期刊