论文部分内容阅读
视频编码技术日新月异,广泛应用于网络流媒体点播,视频监控,VCD,DVD,数字电视广播等领域。视频编码的压缩效率不断提高,适用范围越来越广。视频技术和计算机网络技术以及无线通信技术的交叉又产生许多待研究的领域。本文的工作正是在这样一个视频编码技术和网络技术蓬勃发展的背景下展开的,旨在对视频编码及其网络传输中若干关键性的问题做一些研究。本文的研究内容包括:网络视频系统体系架构;鲁棒的视频编码和传输系统;视频差错掩盖算法;视频编码中的码率控制算法。
文中首先概述了视频编码的现状和遇到的问题并简要回顾了MPEG-4和H.264视频压缩标准的主要内容。接着考察一个网络视频系统的构建。在这里,我们研究了网络视频系统的构成及其支持协议,在深入研究MPEG-4和IETF各相关标准的基础上提出一个网络视频系统架构。此架构基于MPEG-4视频、系统,DMIF标准和RTP协议,支持差错控制和码率控制,并支持多对象、多媒体流并发和多种媒质类型。以后各章的研究以此架构为平台并对其若干组成部件作改进以提高总体性能。
视频在信道传输的过程中可能出现多种形式的差错,差错的出现轻则影响观看质量,重则导致系统崩溃,因而必须妥善处理。传统的差错控制算法往往导致接收端的不兼容或引入大量编码冗余或对信道有特殊要求(如要求反馈信道可用等)。我们提出一个抗丢包的视频编码和传输系统VC3MV(VideoCodingwith3setsofMotionVectors),它包含对一个标准视频系统三部分(位于发送端的视频编码器,网络接口(打包器和解包器)以及接收端的视频解码器)的改进。改进的视频编码器比普通的编码器产生两套额外的运动矢量;网络接口利用RTP协议的语法字段实现兼容性的要求;改进的接收端采用特别的解码逻辑处理不同的差错模式。实验证明它可以减轻丢包的影响并提高显示质量。与传统方案比较,本方案有高效、低延时、低复杂度的特点并能保证接收端的兼容性。
如果没有编码端的参与并且没有反馈信道,在差错发生后接收端往往只能利用差错掩盖算法改善观看质量。差错掩盖主要利用源视频内容中存在的空域和时域冗余,其中视频差错掩盖主要利用时域冗余。经典的视频差错掩盖算法如边界匹配法(BMA,BoundaryMatchingAlgorithm)往往不能处理好边界处象素值缓变的情况。我们提出改进的边界匹配法(IBMA,ImprovedBoundaryMatchingAlgorithm)和改进的MBMA算法(IMBMA,ImprovedModifiedBoundaryMatchingAlgorithm),通过计算基于二阶差分的边界匹配值改进传统的BMA法和MBMA法。实验证明该方法可以更准确地恢复运动矢量并能较好地处理边界处象素值缓变的情况,从而获得较好的恢复效果。最后我们指出IBMA和IMBMA可以看作基于频谱分析的运动矢量恢复方法的特例。
在考察差错传播的过程中,我们发现差错的累积和放大现象。现有的差错掩盖算法均不能很好地解决这一问题。我们提出利用后向更新的差错掩盖方法。通过对象素差错水平的跟踪和后向运动估计的方法,由后向前更新解码帧并降低差错水平。该方案分为前向解码/差错掩盖和后向更新两个阶段。实验证明可以显著提高GOP后部帧的重建质量。码率控制关系到视频的质量和信道带宽利用率。传统的码率控制算法往往平等对待时间上先后顺序不同的帧,而在我们提出的新的码率分配方案中将优先考虑位于GOP前部的帧。另外,采用固定量化值改变范围的方案往往使编码码率长时间偏离目标码率,为此我们提出一种动态量化参数变化范围的方案使编码码率尽快逼近目标码率,可以提高GOP前部的编码帧的质量。实验证明与VM8相比,该算法可提高编码信噪比且使比特率变化更平缓。