三维视频编码中深度失真模型研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:nnhdceh986532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和通信技术的迅速发展,三维视频(Three Dimension Video,3DV)逐渐替代二维视频(Two Dimension Video,2DV)成为下一代主流视频技术。人们观看3DV能获得丰富的立体感和沉浸感。自由立体显示技术的兴起,不仅使观众摆脱了眼镜的束缚,还向观众提供了视点交互选择功能。系统根据用户需求呈现相应视点的3DV。多视视频巨大的数据量,对信息传输基础设施形成挑战。深度增强型数据格式表示的3DV由少量参考视的彩色视频和深度视频组成,在接收端通过合成虚拟视的方式提供多视点视频。深度增强型数据格式3DV减轻了多视视频数据传输量,引起研究者的关注。深度视频用于控制虚拟视合成。研究深度视频的压缩失真对于合成的虚拟视质量的影响,具有重要意义。一方面,在3DV编码过程中,合理控制深度视频失真,能够改善虚拟视质量,提高3DV的视觉体验质量。另一方面,并非所有的深度失真都使虚拟视感知质量下降,利用深度视觉感知特性,抑制了恰可觉察深度差异(Just Noticable Depth Difference,JNDD)阈值以下的深度失真,可以有效提高3DV编码效率。本文对3DV编码中的深度失真机理进行了深入研究,主要学术贡献及创新点包括以下几方面:首先,研究了深度失真对虚拟视失真的影响,建立了基于深度的虚拟视失真模型。深度图划分为平坦块和非平坦块,平坦块使用频域方法整体计算虚拟视失真;非平坦块逐像素分析遮挡关系变化,计算失真代价。在非平坦块中,我们不仅分析误遮挡像素失真,还进一步考虑了误显露像素产生的褶皱失真。边缘区域在深度图中的比例虽小,但是对于虚拟视失真影响显著。为了准确分类深度图分块,我们采用基于视差的深度图编码块的分类准则,建立阈值函数,分类阈值根据拍摄参数和场景参数集调整。本文所提出的模型提高了模型估计性能,平均预测均方误差与实测均方误差差异降低到2.9。然后,以人类视觉系统(Human Visual System,HVS)的立体视觉生理结构和深度感知特性为依据,建立了修正的JNDD(modified JNDD,MJNDD)模型、恰可觉察视差差异(Just Noticeable Disparity Difference Model,JNDi D)模型和感知深度的JNDD模型(Just noticeable perceived depth difference,JNPDD)。MJNDD模型采用三段线性函数建模,比现有两段和四段模型预测准确性高,与主观测试数据的线性相关系数(Pearson Linear Correlation Coefficient,PLCC)达到0.99。JNDi D模型假设辐辏冲突中会聚占优势,为统一表示不同显示观看条件下的JNDi D模型提供了基础。JNPDD模型以自然场景下JNDD阈值为纽带,将各种显示观看条件下的JNDD阈值函数联系在一起,形成函数族。JNPDD阈值依据显示观看参数计算,可以跨显示器使用。最后,我们提出一种面向虚拟视失真的感知编码算法,应用基于深度的虚拟视失真模型修改深度编码率失真准则的失真测度,应用JNDi D模型滤波深度预测残差。实验结果证明该算法提高了3DV编码性能,在保持视觉感知质量的同时降低了码流速率。该算法从应用层面证实所提出的基于深度的虚拟视失真模型和JNDi D模型的有效性。
其他文献
本论文的研究分为两部分.论文第一部分主要研究求解大型稀疏线性方程组的随机Kaczmarz方法的相关数值算法问题,并将其应用到压缩感知、信号重构等问题中.所做工作的相关内容概括如下:1.通过对Kaczmarz算法的研究,利用随机抽样的方法来计算部分残差,作者得到了一种新的求解大型线性系统的数值迭代方法.根据每一次随机选取部分行计算其残差,并选取残差最大的一行来进行Kaczmarz迭代,作者构造了随机
输液管道广泛应用于航空、航天、机械以及能源等各个领域。由于流体流动和外界环境引发的管道振动会对整个结构产生严重的影响,因此对输液管道振动的研究有重要的工程应用价值。同时,输液管道作为一种典型的陀螺连续系统,对其振动特性的分析也有重要的理论意义。当流速处于亚临界范围,管道在零平衡位形附近振动。当流速进入超临界领域,管道在非平凡静平衡位形附近振动。本文基于Timoshenko梁理论和广义Hamilto
大型稀疏线性方程组的求解和大型矩阵指数函数的计算一直是很多科学计算和人工智能领域的核心问题,构造这两类问题的高效算法也一直是数值代数领域的研究热点之一.本文一方面将贪婪的随机Kaczmarz(GRK)算法和随机Gauss-Seidel(GRGS)算法应用于岭回归和分解线性系统的求解当中,构造了这两类线性系统的松驰型随机迭代算法;另一方面,利用反位移技术和重正交化的Arnoldi过程,提出了一种新的
自1903年Fritz Heusler发现哈斯勒合金以来,该类合金已发展成具有1500多个成员、涉及到40多种组成元素的大家族。而Co基哈斯勒合金作为其中重要的组成部分,因其在费米面处100%的自旋极化、具有可调的磁性和电子结构、较高的居里转变温度等特性一直备受关注。许多Co基哈斯勒合金具有高的热力学稳定性、与非磁性半导体或绝缘体晶体结构具有良好的晶格匹配度。部分该类合金即使处在B2无序结构状态下
近年来,矿井、隧道以及购物广场地下限定空间场景无线移动通信问题凸显。现代城市轨道交通系统中基于通信的列车控制(Communication-Based Train Control,CBTC)正逐步使用LTE-M(Long Term Evolution for Metro)通信系统传递列车控制信号,并要求其具有很高的可靠性。然而在地下隧道LTE-M系统使用漏泄电缆传输信号的研究并不完善。为此本文致力于
在经济、管理以及人类社会生活的各个领域中,决策问题无处不在。但是,随着社会的进步、经济的发展以及信息技术的突飞猛进,人们受到决策问题的复杂性和自身认识事物的局限性的困扰往往不能在决策中作出正确的判断。为了获得更加合理和全面的决策结果,一方面,多个决策者被组织起来共同参与决策,做到集思广益和减少偏见,提高决策的水平和质量;另一方面,Zadeh提出了模糊集的概念,它能更好地描述客观事物自身以及人类思维
随着先进多媒体的应用和海量设备的接入,对无线容量及频谱效率的需求迅速提高。由3GPP LTE-A提出的非正交多址接入(Non-Orthogonal Multiple Access,NOMA)已成为5G/B5G提高频谱效率、用户访问能力和用户公平性的关键技术。另外,协作通信技术能够有效提高通信范围及系统分集增益;因此本文将NOMA与协作通信技术相结合,重点对协作NOMA技术展开研究。为不断提高系统分
近年来,城市服务和生活品质升级需求引发国内外智慧城市建设热潮,智慧停车系统作为智慧城市建设的重要载体,成为众多学者的重点研究对象。实时、精准和高效的泊位车辆状态信息是驱动智慧停车系统稳定运作的源动力,而作为现阶段泊位车辆状态测量的关键设备地磁车辆检测器,因地磁信号刻画车辆物理属性的局限性和能量资源的有限性,导致现阶段地磁车辆检测器的感知精准度和生命期无法满足智慧停车系统高效且稳定运作的基本诉求。为
行政价值观是行政主体(政府)对行政客体(行政系统)实施管理实践过程中所形成的价值追求和价值理解,代表着国家的根本利益,具有鲜明的阶级性。中国作为人民民主专政的社会主义国家,其社会主义的本质决定了中国政府的核心价值追求始终是一切为了人民,显著的人民性是中国行政价值观与西方行政价值观最本质的区别。改革开放以来,中国行政价值观的关注重点从以经济为中心,逐渐拓展到经济、政治、文化“三位一体”和经济、政治、
清初书法,碑风兴起。鉴于晚明时期“尚奇”的审美倾向,清初书法开辟出一条“因奇尚拙”的金石书画道路。石涛便是清初践行以“金石入书画”的书家之一。石涛在诗、书、画、印各方面均有造诣,加之其身份复杂,经历坎坷,交友广阔,善于思考,个性矛盾等特点,使得其艺术作品极具张力,于清初江南地区有一定影响力。石涛十岁习书,而后学画。他的学书不同于其画,虽然石涛提倡书画的“无法”之道,在书法上却表现出了汲取魏晋、唐宋