论文部分内容阅读
伴随微博、微信、人脸书、QQ等社交网络工具的飞速普及,图像已经深入人类生活的每个细节。自2011年以来,世界每年产生数百亿张数字照片。对海量图像数据进行分析、筛选、识别、评价、监控、修复和增强,越发迫切地成为当下的研究热点,并引起了多媒体、图像处理、计算机视觉和模型识别等领域研究人员的广泛关注。本论文通过研究人类视觉系统感知的特性,重点对图像质量评价及其应用进行了探索和建模。此问题涵盖了视觉心理学、统计信息学和图像处理学三大范畴,是当下研究的热点和难点。对图像质量评价及其应用的研究,有助于深入揭示视觉心理学奥秘,完善自然场景统计模型,提高图像处理算法性能。本论文的研究工作主要包括以下三个方面:(1)研究全/半参考图像质量评价机理,对由于多种类型失真和观看距离引起的图像降质进行建模。全/半参考评价是指存在完整/部分原始无失真图像信息情况下评估失真图像的质量。针对人类视觉系统高度善于提取图像的结构信息,本论文分析人眼底层视觉特性,计算失真图像和原始图像的梯度相似性,综合全局和局部两种池化策略,提出了基于全局和局部梯度相似性的全参考评价算法。在不同距离下观看同一幅失真图像,主观评分会存在显著差异。此研究更接近实际观看图像的场景,具有更大挑战性。针对增加观看距离会降低人眼分辨能力,本论文根据观看距离去除部分小波子带中的高频信息,建立理想视角、观看距离和图像尺寸之间的三角函数关系,结合图像宽高比计算最优变换尺度对图像进行缩放,提出了基于最优尺度选择的预处理模型。在只允许传输部分原始无失真图像或者其特征时,半参考图像质量评价算法成为了首选工具。针对人类视觉系统对图像结构变化非常敏感,本论文依据被不同类型和强度失真污染的图像会产生不同程度的空间频率退化的规律,使用不同卷积核分别提取原始图像和失真图像特征,采用非线性方法度量特征距离,提出了基于结构退化模型的半参考评价算法。(2)研究自然场景统计特性和多重失真的联合效应,对无参考质量评价进行建模。无参考评价是指不存在原始无失真图像情况下评估失真图像质量。根据新发现的无失真图像统计特性,本论文建立原始图像的自由能感知特征和结构退化特征之间的线性关系,提取基于人类视觉特性和自然场景统计特征,使用机器学习训练上述特征,提出了基于自由能理论的鲁棒无参考评价算法。与单一失真相比,多重失真的降质问题还包括由于不同类型失真之间相互作用引起的联合降质效应。综合经典图像处理算法和人脑自由能理论,本论文使用经典的噪声估计、JPEG压缩评价和高斯模糊评价算法,分别计算每种潜在失真的降质程度,基于人脑自由能理论近似不同失真类型相互作用产生的联合效应,线性综合上述评分,提出了基于六步处理的盲评价算法。与常规失真度量不同,对从高动态范围图像通过色阶映射得到的低动态范围图像的质量评价是另一类新难题。从信息总量、自然统计特性和结构保护能力三方面考虑,本论文衡量低动态范围图像经过亮化和暗化后含有的信息总量,计算其是否符合自然统计特性,考量其对主要结构的保护能力,使用机器学习综合训练上述三方面特征,提出了盲色阶映射图像质量评价算法。(3)研究基于质量评价模型的图像处理技术。现有的对比度增强算法通常需要人工辅助地进行参数调整和结果选择。完善的直方图修正化框架和自动的对比度增强算法具有更高的实用价值。结合主观客观质量评价,本论文新增添有效的对比度变换曲线完善现有的直方图修正化框架,综合信息熵增益和显著性保护,设计半参考质量评价算法,优化直方图修正化框架,提出了基于显著性保护的自动对比度增强算法。远程控制和云计算获得了越来越多的应用,相应的屏幕图像/视频技术因此成为了当前的研究热点。但是现有的算法在评价屏幕图像质量时却相形见绌。根据人眼更多关注屏幕图像中的文字区域,本论文采用结构退化模型估计重要区域,使用结构相似性模型量化失真,综合上述两方面结果,提出了基于结构感知的质量评价模型,并依此改进率失真优化准则提高屏幕视频编码效率。