基于感知的三维视频编码方法

来源 :宁波大学 | 被引量 : 0次 | 上传用户:shanglonghai105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于具有强烈的沉浸感、逼真的效果,三维视频受到越来越多的关注。电路设计、网络传输、信号处理以及视频编码技术的快速发展,促使其广泛应用于各个领域。多视点彩色加深度(Multi-view Video plus Depth, MVD)作为三维视频最常用的场景描述格式,对网络带宽、终端存储能力以及各视点压缩效率要求很高。多视点视频压缩主要是去除空域冗余、时域冗余和视点间冗余,然而视频中还存在大量的感知冗余。研究人员正在将人眼视觉系统(Human Visual System, HVS)的感知特性加入到视频编码中进一步提高视频的压缩效率。但目前的视频感知编码大都未考虑感知模型的复杂度,以及没有合理的多视点视频感知模型。另外,视频逐渐向高分辨率方向发展。而针对高分辨率视频的高效视频编码标准(High EfficiencyVideo Coding, HEVC)巨大的算法复杂度使得其发展受到限制。基于上述分析,文章对基于感知的三维视频编码以及HEVC的算法优化展开了深入研究。(1)由于人眼的感知特性非常复杂,因此基于感知特性建立的感知模型也特别复杂。但许多研究工作没有考虑感知模型的复杂度对整个算法复杂度的影响。针对上述问题,文章根据运动剧烈程度将视频划分成静止、缓慢运动和剧烈运动三类区域,结合时域相关性建立了快速求取感知掩膜的模型。静止区域的感知掩膜可从前面帧的感知掩膜拷贝;剧烈运动区域的感知掩膜难以使用前面帧的感知掩膜准确预测,因此只能重新求取;而缓慢运动区域的感知掩膜可以使用前面帧的感知掩膜预测。最终的实验结果表明,与传统求取感知掩膜的算法相比,该方法在峰值信号感知噪声比不下降的前提下,有效减少77.54%-84.60%的编码时间。(2)研究人员提出了许多单视点视频感知模型,但多视点视频具有双目融合、竞争及抑制等,因此不能将单视点视频感知模型简单地拓展到多视点视频中。针对上述问题,文章利用立体掩蔽效应及恰可察觉失真(Just Noticeable Difference, JND)模型建立了非对称立体视频感知模型。大量的实验结果表明,在保证解码视频主观质量基本不变的前提下,右视点视频的码率降低11.45%-18.69%。(3)为了解决高分辨率视频压缩后数据量庞大的问题,视频编码联合合作组(Joint Collaborative Team on Video Coding, JCT-VC)正在制定HEVC。该标准主要通过适当提高算法复杂度提高视频的压缩效率,但该方式限制了HEVC的应用。针对HEVC算法复杂度高的问题,文章提出了自适应确定编码单元(Coding Unit, CU)深度范围的方法。该方法利用空间相关性自适应地确定CU最可能的深度范围,从而降低编码复杂度。同时,文章根据CU编码后同一层分割CU和该层所有CU率失真代价(Rate Distortion Cost, RDCost)的概率密度函数建立了合适的模型,根据设定的视频质量下降自适应地获得CU提前终止对应的RDCost。另外,文章分析了备选模式列表(Candidate Mode List, CML)中第一个模式与最佳帧内预测模式的关系,提出了一种重新确定CML的方法,该方法通过有效减少CML中备选模式数目降低率失真优化(Rate Distortion Optimization,RDO)过程的复杂度。大量实验结果显示,文章提出的上述三种方法在保证解码视频质量的前提下,有效降低了帧内编码的复杂度。
其他文献
在第三代移动通信中,为了提高频谱利用率、增加系统容量、扩大基站覆盖范围,改善通信质量,以及减小电磁污染等目的,提出了智能天线的概念。智能天线作为第三代移动通信技术中
本文研究了一种分布式无线通信系统中与接纳控制相关的负载均衡问题、话音在无线多业务环境中的性能特征以及可用于无线环境下链路利用率的主动测量方法,并取得如下成果:在新型
科技的发展不断地改变着人类的生活方式和生活环境,随着人们对生活质量要求的提高,科技产品的变化也是日新月异。智能家居将先进的科技水平融入到智能家居中,再加上智能终端地迅
随着电子技术应用领域的不断拓展,以及电子信息技术本身的不断发展,嵌入式系统现在已经进入了一个高速发展的时期。嵌入式计算机技术得到了越来越广泛的应用,已经成为现代电子技
本论文研究了MIMO系统的一些关键技术,对目前MIMO系统的各种信道模型做了介绍,结合现有的模型,提出了一个新的信道模型,为后面MIMO系统其它关键技术的研究打下了基础;论文提出了一
糖化酶(EC3.2.1.3)是属于糖苷水解家族15的一类酶,它从淀粉及其衍生物的非还原末端水解α-1,4-糖苷键,生成β葡萄糖。工业上糖化酶主要用来水解淀粉生产葡萄糖浆以及相关的产品
正交频分复用(OFDM)是一种新颖的高比特率无线通信技术,通过把整个频带分成许多相互正交的子窄带信道,有效地把多径产生的影响降到最低。 但是,OFDM系统却存在着潜在的高峰均
学位
随着以GPS为代表的GNSS不断发展完善,导航系统的应用领域也越来越多。如何使卫星导航系统拥有更高性能、更多功能成为当今研究的热点,所以卫星导航系统射频接收机的研究也被广
谷物作为人类日常饮食的重要组成部分,是人体内营养物质的重要来源,其营养品质直接关系到人体健康。近年来,由于谷物营养品质下降问题严重,人们开始探索新的途径提高其营养品质状