论文部分内容阅读
立体视频系统因其立体特性和交互功能被广泛应用于各个领域,尤其是在摄影业、电视和电影制作中。而视频/图像在采集、编码、存储、传输、显示等环节引入的攻击会极大的影响用户体验质量。因此,改善立体视频服务不仅要保证画面质量,还需提高观看安全性。本学位论文从视觉感知质量、视觉舒适度两个方面展开研究,主要内容如下: (1)实现了一种基于离散余弦变换域的图像质量评价方法。实际应用中很难获得原始图像,部分参考评价方法旨在使用部分特征数据解决失真图像评价问题。通过人眼的多通道特性,以图像块为变换单元,按照给定的重组规则对变换系数排列、组合,得到离散余弦变换域图像;研究发现重组子带系数近似服从广义高斯密度函数,提取重组子带的形状参数、能量信息分别作为统计特征、感知能量特征;将形状参数的改变量和能量信息的丢失量作为支持向量机的学习输入,建立特征与主观值的关系并得到客观预测值。该方法在 LIVE平面图像数据库上的Pearson线性相关系数超过0.96,Spearman相关系数近似于0.95。 (2)提出了一种基于视觉细胞建模的评价方法。在观看立体图像时,人类视觉系统以人眼视网膜细胞为媒介接收、传输和理解双目信息。本文首先以视网膜细胞特性为基础,对简单细胞和复杂细胞进行建模;然后,双目信息经简单-复杂细胞模型处理得到双目融合视点图和双目细胞差异图,采用多尺度结构相似度算法构建双目融合评价模型和双目立体感评价模型;最后,以最优加权方式完成模型组合,得到最终评价模型。该方法在 LIVE对称失真立体图像库上的Pearson线性相关系数在0.94以上,Spearman相关系数在0.93以上。 (3)在立体视频体验领域,视觉安全性一直是关注的焦点,因此视觉舒适度评价和增强具有重要意义。本文从评价和增强两个角度展开立体图像舒适度研究。针对评价环节,本文将视差特征提取与人类视觉关注机制相结合,实现了一种两阶段视觉舒适度评价框架。在第一阶段,本文构建了一种自适应立体视觉显著检测模型,提取一系列显著加权视差统计特征并构成高维特征向量。第二阶段,通过随机森林算法,将特征向量映射为单一舒适度分值。针对增强环节,通过利用基于视差的舒适度预测模型和非线性视差映射模型,提出了一种基于自适应视差调整的立体图像舒适度增强框架,共包括显著加权视差图提取、基于视差的舒适度预测、非线性视差映射和虚拟视点绘制四个阶段。实验结果表明,该方法能够较好的增强不舒适图像的观看舒适度。