论文部分内容阅读
近年来,虚拟现实、多视角和自由视角视频等三维(Three Dimensions,3D)相关技术凭借在远程教育、医疗和娱乐等众多领域的广泛应用而引起人们的密切关注。虚拟视角合成技术是实现这些应用的关键,而视觉质量直接决定该技术能否成功应用。因此,研究面向虚拟视角合成的质量评价具有重要意义。本论文在对国内外研究现状进行深入分析的基础上,对该方向中存在的关键性问题进行研究,具体包括:基于深度图的视角绘制(Depth-Image-Based Rendering,DIBR)过程引入失真影响下的合成图像质量评价、整个虚拟视角合成过程引入失真影响下的合成图像质量评价和虚拟视角合成视频质量评价,并提出相应的解决方案。本文的研究成果能够用于指导虚拟视角合成算法的设计以及多视角纹理和深度的编码,具有重要的理论研究意义和实际应用价值。本文的主要工作及贡献如下:(1)探究DIBR绘制过程引入的失真对合成图像质量影响的特性,提出一种基于局部几何失真和全局清晰度评价的DIBR合成图像质量评价方法。DIBR是虚拟视角合成中的一项关键技术,其局限性主要在合成图像中引入局部几何失真,但也包含一定的全局失真。所以,需要从局部和全局两方面进行评价。而现有的DIBR合成图像质量评价方法主要从局部/全局某一单方面进行评价,且无法准确定位图像中的局部失真区域,从而造成其性能受限。基于以上分析,本文提出一种基于局部和全局评价的方法。对于局部失真,我们提出了一种基于尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)流的局部失真区域定位方法和失真量化方法。对于全局失真,考虑到视角绘制受模糊的影响,我们提出了一种基于人为再次模糊的全局清晰度评价方法。最后,将局部和全局分数结合生成最终的图像质量分数。在多个视角合成数据库中进行的大量实验证明了该算法相比现有质量评价方法的性能优越性。另外,实验也证明了该算法在DIBR算法的性能排序应用中同样具有最佳表现。(2)进一步探索人类视觉系统(Human Visual System,HVS)在感知图像时的特性,提出一种基于实例降质和全局失真评价的DIBR合成图像质量评价方法。上一个工作使用低层次特征描述DIBR合成图像中的局部失真。然而,HVS更倾向于从图像中的显著性物体(实例)这一更高层次特征来判断图像质量,且DIBR合成图像中的局部失真造成了实例质量的下降。基于此,我们通过量化实例降质来更好地描述图像中的局部失真。另外,对于全局失真评价,我们在结合HVS特性的基础上,同时评价了模糊失真和几何形变,这也是现有方法中欠缺考虑的问题。最后,将局部实例质量分数和全局质量分数结合,生成最终的合成图像质量分数。在视角合成数据库中的大量实验证明了该算法的性能优越性及该算法能够应用于DIBR算法的性能评估。(3)探寻整个虚拟视角合成过程中各阶段失真对合成图像质量的影响机理,提出一种通用全参考型视角合成图像质量评价方法。现有的视角合成图像质量评价方法,包括本文的前两个工作,均是针对视角合成过程中单一阶段失真进行评价。而实际应用中,视角合成过程的各阶段均可能引入失真,且各阶段失真对最终合成图像质量的影响特性大不相同。所以,研究针对整个视角合成过程的通用型质量评价方法具有重要意义。基于此,本文通过深入研究各阶段失真对质量的影响,发现它们均会破坏低级和中级结构。所以,本文提出基于低级和中级结构降质的通用型视角合成图像质量评价方法。其中,低级结构通过梯度强度和方向统计共同描述,中级结构通过稀疏编码描述。在虚拟视角合成图像数据库中的大量对比实验证明了该算法在评价整个视角合成过程中的有效性。(4)进一步探求整个虚拟视角合成过程中各阶段失真对合成图像自然场景统计特性的影响,提出一种通用无参考型视角合成图像质量评价方法。工作(3)中提出的算法为通用全参考型。而实际应用中虚拟合成视角图的原始图往往难以获得,所以全参考型方法具有较大局限性。相比之下,无参考型方法具有更大的研究价值。受基于自然场景统计的通用无参考型质量评价方法的启发,本文通过深入研究虚拟视角合成中各阶段失真对合成视角图统计特性影响的共性,发现失真会破坏边缘统计及纹理自然性。因此,本文提出一种基于边缘统计和纹理自然性的评价方法。另外,考虑到高斯差值图具有模拟人类视觉系统特性、对失真敏感且能够有效表达图像边缘和纹理信息的特点,我们提出在该图上提取边缘统计和纹理自然性特征。实验结果表明在评价各阶段失真时,该算法均比传统质量评价方法和现有视角合成图像质量评价方法具有更好的性能和更好的可扩展性。(5)探讨虚拟视角合成视频中的时域失真特性,提出一种针对合成视频的无参考型质量评价方法。在实际应用中,多视角和自由视角等应用多以视频形式出现,所以针对虚拟视角合成视频的质量评价研究具有广阔的应用前景。针对空域失真设计的图像质量评价方法以及针对传统失真设计的视频质量评价方法均无法有效评价视角合成视频的质量,原因在于视角合成视频中的失真主要为局部的时域闪烁失真。基于此,本文提出一种闪烁区域定位方法,并设计了奇异值域的闪烁失真量化方法。在两个视角合成视频数据库中的实验分别证明了本文提出的闪烁区域定位方法的准确性、该算法相比现有质量评价算法的性能优越性以及应用于视角合成算法性能排序时能够和主观结果保持最高的一致性。该论文有图36幅,表44个,参考文献208篇。