论文部分内容阅读
面对庞大的视觉信息,由于处理能力有限,人类视觉系统能自动有选择地处理复杂自然场景中的重要视觉信息,这种优先处理重要信息的能力,也称为视觉选择注意机制,让人类能够快速、准确、有效地完成各种视觉任务。为了找到模拟人类视觉注意机制的计算模型,长期以来,生理学、心理学以及计算机视觉领域的研究者们付出了巨大的努力,并提出了许多视觉显著性检测方法。最近几年,随着生理学和心理学方面的不断发展,视觉显著性检测受到了越来越多研究者的关注。 人类视觉系统通过两种不同的方式对场景进行观察,即快速的、自底向上的、基于显著性的、任务独立的方式和缓慢的、自顶向下的、人为控制的、任务依赖的方式。目前,由于自底向上的方式不依赖于特定的任务,大多数研究都是通过自底向上的方式进行视觉显著性估计。视觉显著性检测能提取图像中的显著性区域,符合人眼的观察行为。因此,各种模型计算出的显著性结果被广泛用于各种计算机视觉和模式识别应用中,如目标分割,目标识别,图像或视频质量评估,图像融合、视频压缩和目标跟踪等。 本文主要针对自底向上的视觉显著性检测方法展开讨论和研究,从人类视觉系统的生理学和心理学特点出发,结合计算机视觉领域中的图像处理技术,提出了新的自底向上的视觉显著性检测模型,并将显著性结果应用到目标识别与目标分割等应用中去。本文的主要研究内容及贡献如下: ①针对不同的应用任务,即显著性目标检测与人眼注意点预测,综述了现有的视觉显著性计算模型的特点和实现方法。通过对比模型之间的优缺点,为提出新方法提供了新的视野。同时,总结了现有的常用数据库和常用评价方式,为深入研究视觉显著性检测方法提供了研究基础。 ②针对人类视觉系统的视野转移过程,结合现有神经生理学和认知心理学等领域的证据和现有视觉注意计算模型的实验结论,提出了一种基于中心偏移的视觉显著性检测方法。首先根据人类视觉系统的注意力特点,定义了一个通用概率模型,将视觉显著性定义为特征和位置结合的条件概率。其次,利用视野中心转移来模拟人类视觉系统的视野转移过程,通过结合图像多尺度分析,在通用概率模型框架下,实现了基于中心偏移的视觉显著性检测方法。实验结果表明,该方法不仅在显著目标识别中优于现有算法,在人眼注意点预测方面也有比较突出的性能。 ③结合现有算法的特点,提出了基于多通道特征融合的视觉显著性检测框架。基于多通道特征融合的方法是在Itti模型的基础上提出的,由特征变换、特征组合、显著性度量和特征图融合等四个部分组成。此框架具有简单有效,利于扩展的特点。在此框架基础上,通过对每个功能部分的改进优化,分别实现了基于散射变换和支持度变换的视觉显著性检测方法。实验结果表明,在此框架下的视觉显著性检测方法,能有效地预测人眼注意点的注意范围,提取出符合视觉特点的显著性区域。 ④利用视觉注意机制的特点,将所提出的视觉显著性检测算法应用到层次目标识别中。通过提取目标图像的显著性区域得到目标的底层显著性特征,结合层次目标识别方法的模拟视觉皮层行为的优点,根据显著度重要性设计学习阶段的模板选择过程,提出一种基于视觉显著性的层次目标识别方法。实验结果表明,基于视觉显著性的层次目标识别方法,能更有效地对目标进行识别,得到更好的识别效果。 ⑤基于人类视觉系统对显著目标的选择注意能力,采用视觉显著性检测的结果实现对交互式目标分割算法的自动初始化,实现了基于视觉显著性的目标分割算法。算法能够增加现有算法的灵活性,同时得到比较准确的目标分割结果。 本论文为基于视觉选择注意机制的视觉显著性检测方法研究提供了新的思路,为基于视觉显著性检测的应用研究做了新的尝试,为人类视觉感知信息的探索和应用提供了一些有意义的参考。