H.264运动估计技术研究与改进

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jianjiaomylove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264/AVC视频编码标准是由ITU-T SG16 Q.6视频编码专家组联合ISC/IEC运动图象专家组共同制定的。H.264为了提高压缩率应用了一些计算度很高的算法,其中运动估计是计算度最高的,这个算法通过在参考帧或者参考块中寻找与当前块相似度最高的匹配块来达到减少需要传输的比特数和占用的网络带宽之目的。由于H.264在运动估计中不仅采用了整象素估计还采用了高精度的分数象素估计,同时引入了多参考帧技术----在多个参考帧中寻找最佳运动矢量,导致它在提高匹配精度的同时也大幅增加了编码复杂度。为了降低运动搜索的复杂度,H.264的官方模型采用了基于预测子集的运动估计算法,这些算法比起只专注于搜索模式的快速搜索算法(三步搜索算法,钻石搜索算法,四步搜索算法)大幅度提高了搜索的效率,因为充分利用了图象的空间与时间相关性。本文首先介绍了H.264视频编码算法采用的关键技术以及一些重要的基于块匹配的运动搜索算法。接着重点介绍了最新JM模型中采用的快速运动搜索算法EPZS,该算法在运动幅度较小并且没有突变运动的视频序列中能达到一个很好的效果,但是当序列有突变或者运动加大的时候它的搜索时间就相对更长。针对这个问题通过对各种运动复杂度的视频序列进行验证,提出了一种能够降低视频序列搜索时间同时保持信噪比在一定波动水平的的改进EPZS算法。EPZS算法中当预测子集S1中的中值预测矢量不满足搜索终止条件的时候,接着会把另外三个预测子集的预测矢量都与门限值T2进行比较。本文的改进算法在检测完预测子集S1后如果没有终止,只检测子集S2和S3中的预测值,如果低于门限值T2就终止算法,否则才检测子集S4。这种把针对大运动和突变运动的预测子集S4与预测子集S2、S3分别与门限值T2进行比较,减少了运动速度偏小的视频序列的不必要搜索。该算法还对基于搜索窗口的预测子集S4根据时间域和空间域的相关性进行了进一步精选,减少了不必要的搜索点数,同时图象还能保持一个较好的信噪比。
其他文献
全双工中继系统能够在相同频率和时间内,同时发送和接收信号,因此与半双工中继相比成倍提高频谱效率。但是由于中继收发端之间存在着信号泄漏,产生了自干扰问题,自干扰使得中
尿沉渣检查是指利用显微镜或其它分析仪器对尿液中的各种有形成分,如红细胞、白细胞、上皮细胞、管型以及结晶等进行辨析和检查,它对肾脏疾病、泌尿道疾病、循环系统疾病和感
电磁矢量传感器阵列信号处理,作为信号处理的一个重要分支,是目前学术界研究的热点问题。电磁矢量传感器(EMVS)由于能够感知电磁波的极化特性,与标量传感器相比,在波达方向(D
数字图像修补技术是图像处理领域的一个重要分支,在污损图像修补、广告和视频图像传输等方面得到广泛应用。本文围绕基于偏微分方程(PDE)的图像修补的原理、数值应用实现以及
图像显著性检测是计算机视觉研究领域重要的一环,在计算机视觉的各个领域得到广泛的应用,作为图像预处理步骤,能够获取视觉感兴趣区域,去除图像中的冗余信息,提高图像处理效
近年来,室内定位技术在现代社会中扮演了越来越重要的角色。一般来说,室内定位方法包括参数化定位方法和非参数化定位方法。在这些方法中,非参数化定位方法中的位置指纹定位
现代战争正经历着一场由机械化战争向信息化战争的转变。信息战的核心是在大量使用信息技术和信息武器的基础上,争夺对战场的信息控制权。新一代作战系统的特点是通过多个传
随着计算机网络通信技术的飞速发展,网络已成为传播和交流信息的重要途径,随之而来的多媒体信息保密通信问题迫切需要解决。数字图像作为信息的重要载体,其加密技术成为了一
语音分离技术在语音识别和说话人识别等语音处理系统中发挥着重要作用,高质量语音不仅能更好地满足入耳听觉需求,也是后续语音处理的重要保障。实际环境中的语音往往会受到干
本文针对大功率LED光源在室内照明的应用,提出了一套室内LED光源照明控制系统。该系统由室内控制盒和模组控制器两部分组成,通过DMX512协议完成室内控制盒对每一个模组控制器亮