基于H.264/AVC的视频编码技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:BEYONDPEAKER
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264/AVC是在以往的视频编码标准的基础上发展起来的最新的也是编码效率最高的视频编码标准。H.264/AVC可以抽象成为两个层次:VCL层和NAL层,前者主要用于提高视频编码的效率,而后者着重于改善视频传输接口。H.264/AVC出色的编码效率和有效的传输接口使得它可以广泛地用于IP网络和无线网络上的视频业务。H.264/AVC存在着与早期的视频编码标准相似的研究课题,如码率控制问题。同时H.264/AVC也深入研究和采纳了一些新的技术,如位于预测回路的去块效应滤波和二进制算术编码。为了更深入理解H.264/AVC,并对其性能进行完善和提高,本文从回路滤波、码率控制和熵编码三个方面对H.264/AVC进行研究。本文最后还将讨论可变长码的高吞吐率解码问题。 本文首先深入地研究了基于分块DCT变换的视频编码中Ⅰ帧和P帧的块效应的来源和特点,分析了H.264/AVC的边缘强度计算方法在计算Ⅰ帧边缘强度时定位和分级不够精确的问题。在此基础上,提出了用基于人眼视觉系统(HVS)特性的边缘强度指导H.264/AVC去块效应滤波的方案。本方案把基于HVS特性计算边缘强度量化为和H.264/AVC相当的5个级别,然后使用这5个级别控制H.264/AVC的边缘滤波器进行滤波。测试结果表明基于HVS的去块效应滤波在QP较低,即块效应较弱时,可以提高Ⅰ帧的主观质量和客观质量。比如在QP为28时,测试序列的PSNR值的平均增幅为0.11dB,解码图像也比较自然。而在块效应较强时,基于HVS的去块效应滤波和H.264/AVC参考软件提供的质量相当。 位于预测回路的去块效应滤波器虽然可以提高编码质量,但会导致编码器和解码器的计算量大幅提高。本文针对H.264/AVC去块效应滤波计算量大的问题,提出了高效的去块效应滤波器方案。该方案使用并行流水线结构提高了跳转操作和选择操作的执行效率,避免了这些操作打破流水线引起的开销。该方案中定义了灵活的数据路径和紧凑的数据结构,提高了滤波前后数据的存取效率。该去块效应滤波器的核心部分,即边缘滤波模块,还可以直接嵌入到处理器当中以降低实现成本。 H.264/AVC的码率控制分为GOP层,帧层和基本单元层三个层次。本文针对码率控制过程中GOP层和帧层的目标比特数计算,提出了基于PID的GOP层和帧层码率控制方法。基于PID的GOP层码率控制,使用一个GOP编码完成后编码使用的比特数和信道可以传输的比特数之差作为误差函数。基于PID的帧层码率控制使用实际缓冲区满溢度和目标缓冲区满溢度之差作为误差函数。基于PID的码率控制方法使用误差函数的积分,导数和误差函数本身计算目标比特数,而H.264/AVC参考软件(JM7.6)中的控制方法仅仅使用误差函数本身计算目标比特数。因此基于PID的码率控制方法可抑制编码质量的波动,表现为在不同编码条件下序列的PSNR值的方差都有所降低。基于PID的GOP层的码率控制方法在CBR信道,VBR信道,及对于有场景切换的序列,PSNR的方差分别平均降低了16%,6.6%,25%,仿真中场景切换序列的平均PSNR值也平均提高了0.12dB。而基于PID的帧层码率控制在CBR信道条件下,PSNR的方差平均下降了12%。 比较了H.264/AVC中使用的CABAC和CAVLC两种熵编码方案,在此基础上把视频编码层(VCL)进一步分解为象素编码层(PCL)和熵编码层(ECL)。象素编码层)计算用于表示压缩视频序列的各种语法元素,而熵编码层根据统计特性对这些语法元素进行熵编码。在此基础上提出了在熵编码层进行熵转码的概念和方案。熵转码可以连接在熵编码方式不同的编码器和解码器之间,把编码器输出的码流转化为解码器可接受的熵编码方式。CAVLC向CABAC转码还可提高编码效率,通常CAVLC向CABAC转码的效率接近但是低于直接使用CABAC编码的效率。这样在不改变编码质量的同时降低编码使用的比特数,从而降低传输带宽或者减少存储空间。 本文还提出了双码流编码方案,即使用一种熵编码方案进行率失真优化得到表示压缩视频的各种语法元素,使用两种熵编码方案对象素编码层得到语法元素进行熵编码编码得到两个码流。这两个码流分别等价于熵转码前后的两个码流。 本文还讨论了MPEG-2中可变长码解码器的高吞吐率实现方案,提出了多路并行的可变长码解码器方案。该方案将反馈回路分成多级流水线进行,各级流水线分别为不同的码流服务,这样打破了关于可变长码长度的反馈回路对可变长码解码器吞吐率的制约,一个解码器内核可以同时为多个码流服务。本方案还提出了基于伪基础地址查表的方法,简化了查表地址的计算过程并且缩减了分组信息表中需要保存的信息,这样减少了实现时所需的硬件资源。该方案是针对MPEG-2设计的,但其设计思路可用于各种可变长码的解码器设计。
其他文献
随着通信技术的高速发展,GPRS无线通信网络已与互联网连接在一起,成为一种可持续利用和开发的资源;嵌入式系统也由于功耗低、性能强等特点,被广泛应用于通信、工业控制等领域。本
Ad Hoc网络是由一组带有无线收发装置的移动终端节点组成的一个多跳的临时性的自治系统。无线令牌环协议WTRP是一种适用于Ad hoc网络的分布式MAC层协议。由于其采用了令牌环
1 病历摘要rn男,45岁.因左手环指外伤收住科室,查T 36.8 ℃,P 82次/min,BP 15/10 kPa,呈痛苦面容.急诊在臂丛麻醉下行左手环指清创缝合术,术中顺利,术后遵医嘱给予5%葡萄糖注
随着计算机与通信技术的发展,图像处理技术被广泛应用于各个领域。伴随着大规模图像数据库的产生,传统的信息管理方式已经不能满足实际的需求。为了便于图像的检索与识别,基
扩频通信技术凭借其抗截获、抗干扰能力强,保密性好等优势,在现代通信中得到广泛的应用。传统的扩频通信广泛采用伪噪声(Pseudo-Noise, PN)序列作为扩频序列,PN序列具有类噪
目的 为提高影像学科急诊关于副舟骨的正确诊断率, 避免误诊.方法 回顾2008-2010年已诊断副舟骨骨折98例, 后经临床及影像资料综合分析确认误诊26例,误诊率为26.5%.结果 将正
目的总结2型糖尿病合并肝脓肿的诊治经验。方法回顾性分析13例2型糖尿病合并细菌性肝脓肿患者的临床资料。结果 2型糖尿病合并肝脓肿症状多不典型,容易受糖尿病及其他并发症
学位
甲状腺功能亢进症(甲亢)是由于甲状腺激素增多引起的机体多系统兴奋性增高和代谢亢进为主要表现的症候群。甲亢诊断一般不困难,但对无典型临床表现的病例易误诊。我院2002-01
文献[1]报道胆囊结石合并胆总管结石的多达10%~20%,由于胆道位置深在或十二指肠内气体干扰,一些合并胆总管结石的患者,尤其是胆道无扩张者,B超不易发现胆总管结石,易致术前漏