基于帧内二次预测的感知视频压缩研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hbffff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种新兴视频应用以及超高分辨率视频的出现,全球范围内的视频数据量正在急剧增长。大量的视频数据给视频的处理、存储与传输过程带来了挑战。视频编码技术则是应对上述挑战的关键解决方案之一。一直以来,国际标准组织都在致力于制定更加高效的视频编码标准,预测、变换、量化及熵编码等多种技术被用于视频编码中以提升其压缩效率。高效的视频编码技术使得视频所占用的空间大幅减少,进而能够被方便地存储与传输,是保证视频应用服务质量与用户体验的关键所在。因此,如何提高视频编码的压缩效率是非常热门且具有重要意义的研究课题。主流视频编码框架通常利用差分预测编码获得预测残差,并对残差数据进行变换、量化及熵编码等操作来达到压缩视频的目的。其中预测编码分为帧内预测和帧间预测,分别用来消除视频中的空间冗余与时间冗余。对预测残差变换之后进行量化可以减少视频中人眼所不敏感的高频信号,熵编码则用以消除编码过程中语法元素间的统计相关性。此外,随着对人眼视觉特性的研究,针对主观视觉质量的感知视频压缩技术也开始被广泛应用。感知视频压缩利用人眼视觉模型计算视频中的感知冗余,并通过去除这些冗余信息来提升压缩效率。本文将对基于帧内二次预测算法的感知视频压缩进行相关研究,以进一步提升视频压缩效率。传统帧内预测的参考像素位于编码块左上方,编码块右下部分像素与参考像素距离较远,也即意味着它们的空间相关性较差,因此这部分像素预测准确度较低,最终的预测残差较大。针对这一问题,本文提出了帧内二次预测算法,在传统帧内预测的基础上,利用编码块的右下边界重建像素作为新增的参考像素,与编码块左上方的参考像素共同对编码块再次预测,提升了预测的准确度,减小了预测残差。在帧内二次预测的基础上,残差可以被进一步降低。传统编码技术通常利用编码前后图像间的客观差异大小作为编码质量评测的标准。但视频最终的接收者是人眼,客观编码方式的结果难以符合人眼主观感受。针对这一问题,本文将利用人眼的亮度自适应效应和对比掩蔽效应,计算图像中的恰可察觉失真大小,并设计一种新的残差滤波器滤除残差中的感知冗余。在滤波过程中考虑到量化失真的影响,本文提出了适用于新一代视频编码标准VVC(Versatile Video Coding)的失真估计模型,计算编码过程中的量化失真,以用来控制残差滤波的精度,保证编码图像的主观质量。通过本文基于帧内二次预测的感知残差滤波算法,编码过程中的残差数据被大幅降低,节省了编码残差所需的比特数,进而降低了编码的码率,提升了编码的压缩效率。实验数据表明,与新一代视频编码标准VVC相比,帧内二次预测与感知残差滤波算法分别能够平均节省其1.18%和5.49%的编码码率,将两者融合后的算法,能够平均节省其6.5%的编码码率,并获得与其相近的主观编码图像质量。
其他文献
眼球凝视估计是利用脸部图像中的眼部区域对眼睛的凝视方向与凝视点进行估计,判断其注意焦点的一种检测方法,其应用范围广具有重大经济价值。相比于早期的物理建模方法,基于深度学习方法的眼球凝视估计在准确率、稳定性、方便性等方面具有显著优势。目前,基于深度学习的单一凝视估计研究要么仅估计凝视点要么仅估计凝视方向,其性能还有提升的空间。基于此,本文主要研究将凝视点估计与凝视方向估计整合至同一个算法中,实现更为
随着无线通信技术的发展,基于位置的服务已经与我们的日常生活密不可分。不同于室外环境,室内环境中接收到的卫星信号很差并伴有复杂的多径条件,实现准确的定位是一项具有挑战性的工作。目前常见的室内定位技术往往需要多个接入点(Access Point,AP)的辅助,如基于接收信号强度指示(Received Signal Strength Indication,RSSI)的定位技术,而一些使用单接入点的定位技
随着空调市场逐渐趋于饱和以及铜材等原材料价格的上升,空调制造行业的生产压力也愈来愈大,而铜材作为空调系统中蒸发器、冷凝器、节流机构和各连接管道的主要生产原材料,其成本约占整个空调器原材料成本的15%,因此减少空调系统中铜材的使用对于降低空调器生产成本、提高企业竞争力具有重要意义。节流短管作为一种新型节流机构,相较于常用的传统毛细管节流组件,其结构简单,铜材消耗量更少,在价格上极具优势,并且节流短管
学位
随着人类社会对数据处理、数据存储系统与信息通信的需求不断增加,数据中心行业成为一个越来越重要的节能领域,数据中心用分离式热管作为一种高效节能的散热设备也受到越来越多的关注。因此,本文基于相变模型设计了为CPU散热的平板型蒸发器,对其内部的流动换热特性进行分析,并对传统结构进行优化;然后设计了用于机柜级散热的分离式热管散热器,从电能使用效率(PUE)及节能率两个方面对其应用于机柜级散热的节能潜力进行
学位
学位
近年来,人工智能(Artificial Intelligence,AI)研究迎来了新一波热潮,人工智能技术进入了一个崭新的阶段。以深度神经网络为代表的深度强化学习技术(Deep Reinforcement Learning,DRL)开始越来越多地被用于科学研究和实际生产。基于深度强化学习的人工智能决策系统在医疗、工业生产等领域具有巨大的应用前景。尽管如此,目前的研究工作仍存在一些问题,如深度学习模
在生物质气化耦合燃煤发电系统中,气化炉多采用流化床气化炉,其一般在微负压或者平衡状态运行,气化生成的可燃气经过换热,降温至常温,经常温增压风机送入锅炉,或者降温到400~500℃,经中高温增压风机送入锅炉。当可燃气降温到常温时,可燃气中的焦油会在管道上凝结,严重时系统可能无法正常运行。当可燃气降温到400~500℃时,可以有效解决焦油的冷凝问题,所以现有的生物质气化耦合发电项目多采用此方式。但考虑
学位