H.264编码算法优化的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:Fllyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264编码标准是由联合视频工作组JVT(JointVideoTeam)于2003年3月正式提出的,它支持从无线移动、视频通信到视频广播及在线流媒体等多种应用,因此日益受到业界的关注。H.264的编码框架和以前的H.26x和MPEG标准相似,但在很多环节上采用了新技术以获得更高的编码效率。由于编码效率的提高是以增加复杂度为代价的,因此如何减少计算复杂度对H.264标准的实时应用尤为重要。实验数据表明,对于H.264的参考编码器来说,运动估计、基于率失真优化的模式选择以及变换和量化模块的计算复杂度最高。因此本文对这三个方面进行研究以优化编码算法的复杂度。 对于编码器来说变换和量化模块是编码过程的重要环节,由于中低码率视频运动相对平缓,运动搜索的计算量较小,编码器用于变换和量化的计算量比例增大,因此降低这一部分的计算量是很有必要的。本文首先分析了H.264的整数变换和量化的原理,在分析H.263标准中全零块判别算法的基础上,给出判别闽值与误判和漏判的关系,并提出了适用于H.264标准的全零块判别准则,以及两个判别公式。实验结果表明,本文的判别公式能够随着量化参数自适应的调整,在无误判的前提下,与参考编码器相比,当量化参数大于36后,在头肩像序列中两种方法都可以节省51.05%以上的运算量;在运动剧烈序列中量化参数大于40后两种方法也都能节省34.71%以上的运算量。而且随着量化参数的增大,全零块的比例逐渐增多,本文算法能节省更多运算量。另外,研究表明,对于不同的物体或者背景,人眼的敏感度也不同。因此,利用人眼的视觉系统特性,根据视觉敏感区和非敏感区,以及二者间的边缘区对全零块判别公式进行了改进,对不同的应用给予不同的判别值,实验证明,这一方法在无误判的前提下,与没有视觉控制的全零块判别方法相比,正确判断率提高了1.85%~12.99%。 帧内预测技术是H.264不同与以往标准的特点之一。本文在分析帧内预测原理以及预测模式选择的基础上,提出了一种新的帧内预测模式选择算法。算法通过三个原则来加快编码速度,一是相邻宏块预测模式相关性原则,二是预测模式尺寸预先选择原则,三是提前中止原则。编码器根据宏块在图像中的位置以及相邻已编码宏块的预测模式来预先判别待编码宏块的预测模式。若预测模式不符合提前退出原则,就对编码块的像素进行边缘提取,根据边缘方向选择相应的预测模式,在搜索过程中同样遵循提前退出原则。实验结果表明,与全搜索算法相比,在编码质量相近的情况下,能够节省51.01%~72.91%的编码时间,与单纯的边缘检测的算法FIMDA相比,能够节省15.63%~27.31%的编码时间。 H.264的多预测模式选择技术提高了编码效率和率失真性能,但也使得编码的复杂度增大。参考编码器的全搜索算法是通过穷尽所有的预测模式,从中选择代价函数值最小的作为最优预测模式。本文在研究H.264帧间模式选择过程的基础上,分析了多预测模式帧间预测的复杂度,介绍了帧间模式选择算法的研究现状,并提出了一种基于全零块分布的帧间预测模式选择算法。算法通过宏块中全零子块的分布,各子块SAD值的大小和运动向量大小作为判据来缩小待选模式集(包括帧内预测模式和帧间预测模式),提高编码速度。实验数据表明,与全搜索算法相比,本算法在编码质量接近的同时,能够提高1.373~1.931倍的编码速度。 运动估计是占用整个编码器运算时间最长的部分,本文在分析H.264运动估计原理基础上,对运动搜索模式与视频序列之间的关系进行研究,并提出了一种基于上下文的自适应运动搜索算法。算法通过分析序列编码结果,根据已编码帧的预测模式分布和序列的运动信息,对运动特性不同的宏块选择相应的运动搜索方案,并结合提前退出策略以及分层的搜索模式,既加快了搜索速度,又保证了搜索的质量。实验结果表明,算法在编码质量接近全搜索算法的基础上,平均搜索速度是全搜索算法的89.1倍。与一些经典的搜索算法相比,本文算法在速度和质量上都要优于传统的钻石搜索算法,新三步法,六边形搜索算法,而且适用于不同运动特性的视频序列。 统计结果表明,多参考帧选择技术提高了有暴露背景或者新增景物区域的编码效率,但是在多数情况下,视频编码性能的提升不大,只有无法补偿图像区域才可能用到多参考帧预测。因此,本文提出了一种基于上下文的多参考帧选择算法,利用宏块的运动特性决定当前宏块搜索的最大参考帧数目,通过分析当前参考帧预测的结果,动态的判断是否需要进行下一参考帧预测。从而对图像中不可补偿区域可以进行多参考帧搜索保证图像的编码效率,而对不需要多帧参考的宏块则节省了编码时间。实验结果表明,在编码质量接近全搜索算法的基础上,本算法搜索速度为全搜索算法的2.10~2.65倍。
其他文献
射频识别技术是一种利用射频通信实现的非接触式自动识别技术。  本文主要将智能天线引入到了RFID阅读器接收机中,并利用4根接收天线来实现阅读区域空间分割,以解决UHF RFID
随着通信技术的发展,视频会议和电话会议是近年来发展较快的新业务,它能提供免提功能(即同时使用扬声器和麦克风)。在这种同时使用麦克风和扬声器的通信场合中,回声抵消器是一个
电力线载波通信是电力系统特有的一种通信技术,在电力系统具有广泛的应用。在我国电力线载波通信是在40~500kHz的载波频率上进行的,并且划分为115个4kHz的通道。近年来随着电
随着智能家居技术的日新月异和人民生活水平的不断提高,人们对智能家居系统的要求越来越高。智能家居系统要达到使生活舒适、便利、节能、安全、高效的目的,很大程度上依赖于
WiMAX(World interoperability MicrowaveAccess)技术可以提供固定、移动、便携形式的无线宽带连接,并最终能够在不需要直接视距基站的情况下提供移动无线宽带连接。正交频分
水声通信网络越来越广泛地应用于军事、石油工业、科研数据采集、新能源开发等领域,由于水声通信网络在实际应用中具有重要地位,因此对水声通信的研究正成为通信领域研究的热点
本论文主要阐述了通用雷达信号处理机的模块化设计,并在此基础上设计了机载雷达信号处理器系统。为了满足新一代雷达的高实时性、高可靠性及研发周期短的要求,通用雷达信号处
本文针对嵌入式网络的发展前景和基于SNMP网络管理的广泛应用,分析了在嵌入式网络管理代理(SNMPAgent)在微波设备网络管理中应用的可行性,提出一种基于SNMP协议的新型嵌入式网
近年视频监控系统得到了迅速的发展,应用范围不断扩大。同时,模拟监控系统正在逐步被数字监控系统取代,不仅极大提高了图像质量和稳定性,而且增加了抗干扰能力并易于存储和网
立体视觉技术已经大量应用到了现代人的平时生活当中,并且在继续改变着我们的生活水平及生活的方式与质量。立体匹配技术是双目视觉的重要组成部分,通过多年的研究与探索,已经获