论文部分内容阅读
随着立体视频显示技术的逐渐成熟,立体产品被广泛应用于各行各业之中,如立体视频会议系统、3D电影、立体广告、虚拟现实(Virtual Reality,VR)体验等。3D内容制作及立体图像与视频处理已经为人类带来了巨大的经济和社会效益,而且蕴藏着巨大的发展潜力。对立体显示系统呈现给人眼的立体图像进行感知质量评价,是立体技术应用中的关键技术之一,主要包括两方面:一是类似于平面图像质量评价,考虑图像失真程度对立体图像质量的影响;二是针对立体显示技术引起观众视觉疲劳、眩晕等不舒适现象,对立体图像的视觉舒适度进行评价。基于机器学习算法设计客观评价模型,是当前立体图像评价领域的主要研究方法。本论文研究了符合人类视觉感知特性的立体图像评价模型,主要创新点包括:(1)提出了一种基于多核增强学习的立体图像舒适度评价模型。针对现有模型一般采用单一回归算法而很难选定一种合适的回归函数问题,该模型利用基于AdaBoost的多核学习算法,学习多个弱分类器并集合成一个强分类器,将分类概率映射成舒适度值,就可得到测试图像的立体图像舒适度评价结果。在现有公开测试集上,同已有多种模型比较,该模型具有更好的通用评价性能指标。(2)研究了非对称图像的掩蔽效应,建立了能反映掩蔽效应作用效果的非对称立体图像数据库,为后续基于机器学习的立体图像质量评价算法提供训练样本。由于掩蔽效应的存在,在立体图像非对称失真时,左右图像的失真差异在一定范围内的变化不会被人眼感知。在建库过程中,固定左视点失真程度,逐渐增大右视点的失真程度,观测非对称立体图像相对于对称立体图像的总体质量变化是否会被人眼感知;根据人眼感知结果,将立体图像分成两类,从而建立起一个带标签的非对称立体图像数据库。本文分别建立了三种不同失真类型的非对称立体图像数据库,且数据库的原始失真立体图像均是舒适的。(3)提出了一种非对称立体图像无参考客观质量评价模型。该模型利用新建立的带有类别标签的非对称立体图像数据库,首次将LC-KSVD算法中用标签监督字典学习的方式应用到图像质量评价领域,分别学习了左右视点的特征字典和质量字典。在测试阶段,通过稀疏重建得到左右图像的质量值并联合两者得到立体图像质量。在公开测试库上,同多种算法比较,该算法对各种失真类型的非对称图像测试性能都更好;并且关于对称图像的评价性能也良好。