论文部分内容阅读
随着网络通讯技术的迅速发展和个人消费电子产品性能的不断提高,面向网络的视频应用正变得越来越普及.在互联网这种复杂异构网络环境下,网络视频应用面临着不同用户的传输带宽差异,带宽的短时波动等问题.另外,不同的用户设备可能具有不同的处理速度、内存处理空间,以及不同的显示分辨率.这要求视频编码方法和传输的视频码流具有一定的灵活性和可伸缩性.因此,可伸缩视频编码,尤其是基于小波的可伸缩视频编码成为近年来视频编码领域的研究热点.
本文在已有的三维小波视频编码方法基础上,针对他们的编码效率和可伸缩性进行了深入的研究,创新性地提出了若干技术,提高了三维小波视频编码中的运动补偿时域滤波的有效性,改进了宽码率范围下的质量可伸缩编码性能.针对分辨率可伸缩性,本文从码率分配和编码框架两个方面,提出了若干技术大幅提高了传统方案的分辨率可伸缩编码性能.具体的,本论文的主要研究成果如下:
首先,本文为三维小波视频编码中的运动补偿时域滤波(METF)提出了一种Barbell提升型模型.基于Barbell提升型,运动补偿时域滤波过程可以支持多对多映射,解决了传统的方案中不能有效处理相邻帧之间多对一映射、单向或者双向断开等情形的问题.Barbell提升型模式还自然地建立了预测步中的子像素插值和更新步中的插值之间的逻辑关系.在具体编码方案中,我们在预测提升步引入了若干项技术,包括分块大小自适应的运动补偿、重叠块运动补偿、可伸缩运动场编码等,来提高帧间预测有效性和编码性能.
其次,本文研究了三维小波分解中的运动补偿时域滤波过程导致的空域子带耦合现象,量化分析了子带耦合的强弱,提出了一个信号传递模型来量化MCTF过程中信号在各个空域子带之间的传递.基于这个信号传递模型,我们提出了一个码率分配算法来解决空域MCTF中的高频漂移问题.实验结果表明这个方法能够显著提高重构低分辨率的主观和客观质量.
第三,针对传统的空域可伸缩小波视频编码方案中存在的问题,我们提出了一种无冗余的多分辨率MCTF方案,我们称为In-Scale MCTF方案.这种方案将SDMCTF扩展到多个分辨率层,同时各个分辨率层的运动补偿经过子带分解和重新组合,低分辨率的运动补偿预测嵌入到高分辨率层的运动补偿预测中,从而保证最终的多分辨率MCTF分解结果中不存在层间冗余.和空域MCTF相比,In-Scale MCTF方案能保证编解码端的匹配性.与MRMCTF相比,In-Scale MCTF方案消除了金字塔编码结构中的冗余,从而提高了编码性能,同时还保证了完全重构特性.实验结果表明这种编码框架同时具有很好的空域可伸缩性和良好的编码性能.
第四,我们进一步把小波编码中的In-Scale运动补偿技术扩展到H.264/MPEG-4 SVC中,来提高H.264/MPEG-4SVC的空域可伸缩性编码性能.我们对小波编码中的In-Scale运动补偿技术主要进行了三个方面扩展.第一,从只支持小波滤波器扩展到支持任意的上下采样滤波器.第二,针对IL264/MPEG-4 SVC的分层编码结构,将In-Scale运动补偿中的层间开环反馈变为层间闭环反馈.第三,针对空域可伸缩与质量可伸缩结合的应用,提出了更灵活的自适应In-Scale预测技术.这个方案以一种新的方式来为高分辨率层视频帧产生预测信号,它可以同时结合和利用时域相关性和跨分辨率相关性.高分辨率层视频帧的低频部分的预测信号从同一帧的低分辨率层获得,而高频部分的预测信号从时域相邻帧通过运动补偿和高频滤波获得.这种In-Scale预测技术结合了H.264/MPEG-4 SVC中Inter预测模式和IntraBL预测模式的优点.实验表明我们所提的自适应In-Scale预测技术能够显著改善H.264/MPEG-4 VC的空域可伸缩编码性能.