视觉显著度提取及其在视频编码中的应用研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:bluelee530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的视频压缩方法主要方法是去除视频数据之间的客观相关性,即时间和空间上的冗余信息。并且码率控制技术平等的对待图像中的每一个编码单元,平均分配码率资源。而人类在观看视频序列时受人眼的视觉机制影响,并没有将注意力平均分配给图像的每一个区域,而是更为关注图像中一些显著性高的区域。本文研究的主要内容就是利用人类的视觉机制进行显著度建模,在提取视觉显著度信息之后,将其用于指导视频编码中的码率分配。其中针对视觉显著度提取,我们提出了一种新的基于曲波变换的显著度模型,该模型可以准确的检测出自然场景中显著性较高的区域;然后又提出了一种适用于视频编码的显著度模型以及基于显著度的宏块层QP调整方案。本文研究的工作主要包括以下三个方面:(1)提出了一种基于曲波变换的显著度模型。该模型首先利用曲波变换得到多尺度的曲波系数,然后进行曲波逆变换重建出多尺度的特征图,最后经过相应计算得到最终的显著度图。(2)提出了一种适用于视频编码的显著度提取方法以及基于显著度的宏块层QP调整方案。首先提出了一种适用于视频编码的显著度模型,该模型包括空域显著度提取、时域显著度提取和空时域的融合策略。然后利用得到显著度值,通过线性微调的策略,将之用于宏块层量化参数的微调。(3)在实验中引入基于眼部轨迹加权的EWSSIM(Eye-tracking Weight Structural Similarity Index,EWSSIM)作为主观性能指标。大量实验表明:本文提出的显著度模型可以准确的提取视频中显著度性高的区域。基于显著度的视频编码可以在保持客观质量的基础上,提高视频的主观质量。
其他文献
移动互联网的飞速发展,丰富了人们生活的同时,也对蜂窝网络提出了更高的通信需求。为此,各种类型的蜂窝大量部署。然而基站数目的增加不可避免的会带来更大的能耗。考虑到经
本论文重点研究了基于体域网的移动健康护理平台的方案设计以及平台下业务功能的实现方法。   论文在简要介绍体域网及移动健康医疗的基础上,设计了面向医疗健康服务的移动
虚拟网络映射是一种解决未来互联网发展问题的关键技术,该技术能够使多个异构的虚拟网络共存于同一个物理网络,共享底层资源。传统的虚拟网络映射算法大多是针对网络负载较高
水下传感器网络(Underwater sensor network,简称UWSN)是构成水下环境立体监测系统的重要部分,它由大量具有感知外部环境、计算和通信能力的传感器节点组成,各节点被分布在指定
多点协作(CoMP)技术是LTE-A的关键技术之一,能够显著提高小区吞吐量和边缘用户速率,但是要实现CoMP传输,基站需要获得协作区域内所有用户与基站间的全部信道信息。虽然信道信
EPON技术作为以太网技术和无源光网络技术的结合,天然具有无源光网络技术的高带宽与设备无源的优点,同时与目前获得大规模应用的以太网设备之间不需要协议转换,是解决称之为
近年来,随着多媒体及网络技术的飞速发展,多媒体信息的数据量急剧的增多,人们已经不能满足于通过歌名、歌词、演唱者等信息进行的文本检索。特别是当人们只记得歌曲的某一旋
作为车牌识别系统的关键环节,车牌倾斜校正始终是车牌识别领域具有挑战性的问题,车牌倾斜直接导致车牌识别准确率降低。作为车牌识别知识产权IP(Intellectual Property)核工
数据业务需求的爆发式增长使超密集无线网络成为研究热点。根据网络中内容受欢迎的程度即流行度将热点内容进行缓存,将通信、计算、存储多维资源进行联合优化,是超密集网络研