三维小波可伸缩视频编码技术的研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:ggg042001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络通讯技术的迅速发展和个人消费电子产品性能的不断提高,面向网络的视频应用正变得越来越普及.在互联网这种复杂异构网络环境下,网络视频应用面临着不同用户的传输带宽差异,带宽的短时波动等问题.另外,不同的用户设备可能具有不同的处理速度、内存处理空间,以及不同的显示分辨率.这要求视频编码方法和传输的视频码流具有一定的灵活性和可伸缩性.因此,可伸缩视频编码,尤其是基于小波的可伸缩视频编码成为近年来视频编码领域的研究热点. 本文在已有的三维小波视频编码方法基础上,针对他们的编码效率和可伸缩性进行了深入的研究,创新性地提出了若干技术,提高了三维小波视频编码中的运动补偿时域滤波的有效性,改进了宽码率范围下的质量可伸缩编码性能.针对分辨率可伸缩性,本文从码率分配和编码框架两个方面,提出了若干技术大幅提高了传统方案的分辨率可伸缩编码性能.具体的,本论文的主要研究成果如下: 首先,本文为三维小波视频编码中的运动补偿时域滤波(METF)提出了一种Barbell提升型模型.基于Barbell提升型,运动补偿时域滤波过程可以支持多对多映射,解决了传统的方案中不能有效处理相邻帧之间多对一映射、单向或者双向断开等情形的问题.Barbell提升型模式还自然地建立了预测步中的子像素插值和更新步中的插值之间的逻辑关系.在具体编码方案中,我们在预测提升步引入了若干项技术,包括分块大小自适应的运动补偿、重叠块运动补偿、可伸缩运动场编码等,来提高帧间预测有效性和编码性能. 其次,本文研究了三维小波分解中的运动补偿时域滤波过程导致的空域子带耦合现象,量化分析了子带耦合的强弱,提出了一个信号传递模型来量化MCTF过程中信号在各个空域子带之间的传递.基于这个信号传递模型,我们提出了一个码率分配算法来解决空域MCTF中的高频漂移问题.实验结果表明这个方法能够显著提高重构低分辨率的主观和客观质量. 第三,针对传统的空域可伸缩小波视频编码方案中存在的问题,我们提出了一种无冗余的多分辨率MCTF方案,我们称为In-Scale MCTF方案.这种方案将SDMCTF扩展到多个分辨率层,同时各个分辨率层的运动补偿经过子带分解和重新组合,低分辨率的运动补偿预测嵌入到高分辨率层的运动补偿预测中,从而保证最终的多分辨率MCTF分解结果中不存在层间冗余.和空域MCTF相比,In-Scale MCTF方案能保证编解码端的匹配性.与MRMCTF相比,In-Scale MCTF方案消除了金字塔编码结构中的冗余,从而提高了编码性能,同时还保证了完全重构特性.实验结果表明这种编码框架同时具有很好的空域可伸缩性和良好的编码性能. 第四,我们进一步把小波编码中的In-Scale运动补偿技术扩展到H.264/MPEG-4 SVC中,来提高H.264/MPEG-4SVC的空域可伸缩性编码性能.我们对小波编码中的In-Scale运动补偿技术主要进行了三个方面扩展.第一,从只支持小波滤波器扩展到支持任意的上下采样滤波器.第二,针对IL264/MPEG-4 SVC的分层编码结构,将In-Scale运动补偿中的层间开环反馈变为层间闭环反馈.第三,针对空域可伸缩与质量可伸缩结合的应用,提出了更灵活的自适应In-Scale预测技术.这个方案以一种新的方式来为高分辨率层视频帧产生预测信号,它可以同时结合和利用时域相关性和跨分辨率相关性.高分辨率层视频帧的低频部分的预测信号从同一帧的低分辨率层获得,而高频部分的预测信号从时域相邻帧通过运动补偿和高频滤波获得.这种In-Scale预测技术结合了H.264/MPEG-4 SVC中Inter预测模式和IntraBL预测模式的优点.实验表明我们所提的自适应In-Scale预测技术能够显著改善H.264/MPEG-4 VC的空域可伸缩编码性能.
其他文献
随着人民生活水平的提高和对生活质量的追求,智能家居逐渐走进人民生活并得到迅速发展。其中一个关键技术,音视频监控越来越受正视。而嵌入式技术和无线网络技术的日臻成熟,
USB于1994年由Compaq、Intel、Microsoft和NEC等多家公司推出,凭借其即插即用、廉价、可选择的多种速度模式以及广泛的软硬件支持等特点,日益成为通用的串行总线接口.同时,随
在芯片的设计流程中,一般采用多种验证手段来确保芯片的正确性,包括功能验证,时序验证,测试验证等.其中最耗时的当推是功能验证,它主要是芯片流片之前,通过对芯片的软件模型
随着网络通信技术的发展和网络应用的普及,人们已经不再满足于单一的通信服务,经常可以看到人们利用Email,即时消息,IP电话,视频等多种通讯工具的共同工作来达到便捷的通信活动,人
学位
信息检索中的排序(Ranking)问题是指给定某个查询和一候选文档集,检索引擎计算每个文档和该查询的相关性,并根据相关性将文档列表返回给用户。排序学习(Learning to rank)已成
面对日益增加的网络带宽和负载,如何提高网络安全程序的性能是当前安全系统所面临的挑战.Peder Jungck等人在[JSO4]提到,网络带宽与当前处理器能力矛盾是这一问题的根本.因此
随着半导体工业的发展,微处理器的集成度和工作频率在迅速的提高.与此同时,微处理器芯片内部的时钟偏差问题也越来越严重,确保电路运作的正确变得越来越困难;此外微处理器与
下一代互联网络演进的一个重要趋势是IP网络将成为语音和视频等应用的主要承载.VoIP(Voice over IP)是一个重要的语音应用.由于语音传输的机制不同,VoIP有着传统电话无法比拟
随着网络带宽的飞速增长以及各种应用不断涌现,同时具有高性能和可编程能力的网络处理器,得到了越来越多的重视和应用.网络处理器通常采用多个可编程的处理引擎以及专门协处
机群已经成为主流的并行计算机体系结构,但是随着机群系统规模的不断扩大,机群系统的可靠性却呈下降趋势.深入研究机群容错技术,提高机群系统的可靠性和可用性已经成为当前机