基于视觉计算和人类感知的图像质量评价研究

来源 :西安电子科技大学 | 被引量 : 3次 | 上传用户:stwl1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉作为人类最重要的感知机制之一,构成了人类日常生活中百分之八十以上的信息来源。亿万年间,视觉帮助人类学习关键知识、理解生存环境,成就今天高度发达的现代社会。上世纪,自照相机的发明,人类社会跨入了视觉信息的时代。近几十年来,数字图像逐渐成为日常生活中应用最广泛、最高效的信息媒介之一。学术界为求图像的高保真、高质量开展了大量研究。然而伴随着图像的采集,传输、处理以及存储等过程,图像不可避免地遭受不同类型、不同程度的失真。因此,为减弱图像失真、优化图像处理系统、提高用户观看体验,图像质量评价的需求应运而生。基于人类感知与视觉计算,本文旨在:1)基于视觉系统与高层感知机制,提供就图像质量评价全面且深入的分析与研究;2)建立符合人类主观质量认知的客观图像质量评价准则及相关方法。为此,本文系统并全面地探讨了影响人类视觉质量感知的各方面因素,深入地分析了针对图像质量具有敏感性的各类图像特征指标。考虑人类定性质量评价现象、结合人类视觉注意机制、引入无监督视觉质量特征学习理论,本文创新地提出了若干突破性思路,建立了新颖的图像质量客观评价体系与方法,探索了图像质量评价领域的未来研究方向。具体而言,本文所提方法与主要贡献如下:1)提出了一种基于模糊分类的部分参考型图像质量评价方法。通过引入人类对图像质量感知的定性评价准则,结合模糊集合理论,针对通信系统特定应用环境,本章提出了一种快速、有效的部分参考型图像质量评价方法。该方法将图像质量空间等分为若干模糊集合,借助小波域自然场景统计特征,训练基于人工神经网络的模糊分类器。待测图像质量得分由模糊集合及其对应隶属度去模糊求得。在通用数据库上充分的实验结果验证了该方法的有效性与准确性,并且与同类典型方法相比具有一定优越性。2)提出了一种基于深度学习网络的无参考型图像质量评价方法。人类视觉系统具有典型的深度层级结构,因而产生复杂的非线性映射。传统机器学习理论受限于学习层数过少,无法准确刻画高度的非线性结构,因此在建模人类视觉系统上捉襟见肘。本章结合深度学习网络,探索了图像质量的自然语言定性描述规则,建立了统一的深度学习图像质量评价模型。具体而言,利用小波域自然场景统计特征,待测图像经由判别性深度学习网络被分为“优秀”、“好”、“良”、“差”以及“极差”五类。结合贝叶斯理论,创新地设计了图像质量综合模块,得到了包括图像质量定性描述、定量评价以及质量分布的图像质量分层描述规则以迎合不同应用场合需求。实验证明其性能优于同类经典方法,同时验证了基于分类的质量评价模型较基于回归的方法具有更好的小样本鲁棒性以及建模人类感知的合理性。3)提出了一种基于信息散度的视觉显著性检测方法服务于后续质量评价研究。视觉显著性检测通过有效降低视觉冗余信息、强调视觉重要区域从而改变人类视觉质量感知结果。基于信息差异导致视觉显著性这一假设,本章设计了信息散度针对信息差异的描述规则,提出了一种有效的两步法框架用于视觉显著性检测。其中,首先利用独立成分分析,结合高斯差分滤波,有效地获得图像的稀疏特征;其次,结合贝叶斯惊奇模型分析计算图像的信息散度,进而得到图像的显著性度量。多种数据库上的大量实验结果表明此方法较同类典型方法具有更好的主客观一致性。4)提出了一种视觉显著性引导的无参考型图像质量深度评价方法。受视觉注意机制影响人类质量感知启发,本章结合了信息散度视觉注意模型和图像质量深度学习网络模型,提出了一种统一、有效的无参考型图像质量评价模型。首先,利用视觉显著性加权的小波域自然场景统计特征训练深度学习质量评价网络;分类结果连同置信概率输入基于贝叶斯理论的图像质量综合模块;最终输出图像质量分层描述结果。实验验证了所提方法在通用数据库上的有效性,证实了视觉注意的引入对图像质量评价的促进作用。5)提出了一种视觉显著性引导的图像质量特征学习方法。现有图像质量评价模型大多手动设计与微调图像质量特征,其费时费力且极大限制了图像质量评价方法的灵活性与适用性。为解决这一问题,本章提出了一种视觉显著性引导的无监督质量特征学习方法。具体而言,首先利用信息散度检测视觉显著区域;进而结合独立成分分析,设计了图像质量特征的全局编码方法。所得特征用于无参考型图像质量深度评价方法,在通用数据库上取得了与典型方法相当的评价性能,验证了该特征学习方法对图像质量编码与表示的有效性。本文通过探索基于人类感知和视觉计算的图像质量评价模型以及相关领域的研究方法,尝试回答计算机视觉领域的基本问题之一:人类是如何“看”的。通过跨学科地结合神经心理学、生理学、机器学习等领域最新研究成果,本文所涉及方法,从部分参考型图像质量评价,到无参考型质量评价模型,进而深入基于视觉注意的质量描述,从不同角度、不同方向,系统全面地分析了基于人类感知和视觉计算的图像质量评价领域。文中所提新方法、新观点为图像质量评价领域的未来研究方向提供了一定的参考和有益的借鉴。
其他文献
背景肠道菌群是人体最复杂也最重要的微生态系统,具有为人体提供营养、调控肠道上皮的发育以及促进免疫系统的发育与成熟、保护宿主免受外来病原体的攻击等功能。肠道菌群能
为了降低空间激光通信系统中空间光到单模光纤的对准难度,采用单模多芯光纤对信号光进行接收。以单模七芯光纤为例,建立了空间光耦合到单模多芯光纤的数学模型,分析了数值孔
文章通过分析国内外相关文献,运用结构方程模型(SEM)方法,构建自行车休闲活动的休闲阻碍、休闲涉入与休闲利益的结构方程模型,对休闲阻碍、休闲涉入和休闲利益的关系进行探讨。以
自古以来,养殖业就是广大农牧民改善生活增加收入的重要途径。自党的十九大召开以来,我国的整体发展已经进入了全新的时代,市场随之出现新变化以及新的发展目标,而国家也频频
马铃薯(Solanum tuberosum L)为茄科茄属一年生草本植物,因具有耐干旱、产量高等优良品质而在世界范围内被广泛种植,是继小麦、水稻、玉米后的第四大粮食作物。2015年,我国政
现代排球运动快速发展,尤其表现在进攻向着高度高、力量大、速度快、攻点多的立体化纵深方向快速发展,进攻的突飞猛进就给防守带来了严峻的挑战。本文将排球防守做为一个系统,将
作为城市大型交通基础设施的重要组成部分,大型铁路交通枢纽汇集了多种交通模式,进出人流量大,换乘流线多,其商业模式的研究、商业设施的规划、商业空间的布局、开发和运营面临全
鸡大肠杆菌病是由大肠杆菌感染引起的,极易引发病鸡死亡,尤其是雏鸡,死亡率更高。养殖户应采取科学措施预防鸡大肠杆菌病,以减少经济损失。基于此,对鸡大肠杆菌病的诊疗有重
禽脑脊髓炎(A_E)是一种引起雏鸡、火鸡、野鸡(雉)和鹌鹑感染的病毒性疾病。幼禽感染以共济失调、进行性麻痹为特征,通常还伴有头颈震颤等症状,成年禽鸟感染后通常没有明显症
牛肉营养丰富,深受消费者喜爱。现今因人们生活水平的提升,牛肉市场需求量增加,牛的养殖规模扩大,已成为养殖者的增收致富路径。疾病防控是养牛业的重要环节,若落实不到位可