基于生物启发和计算导向的图像显著性检测

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:wwwvvv79
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于视觉显著性模型在计算机视觉领域的广泛应用,其受到越来越多学者的关注。现有的显著性检测模型可以大致分为三类:生物启发型、纯计算导向型和混合型。生物启发型模型基于生物认知方面的研究成果进行建模;纯计算导向型模型基于有效的数学工具来提升检测性能;混合型的显著性检测模型既能够使用生物启发型模型中人类视觉先进的认知特性,又能够使用纯计算导向型模型中丰富的数学工具。本文从混合型模型出发将生物认知特性融入到有效的计算工具中,并针对视觉显著性领域中人眼注视点预测和显著目标检测这两个子问题对图像显著性进行建模,主要工作如下:  (1)针对现有基于一种或两种认知特性的人眼注视点预测模型性能不佳的缺陷,本文结合了全局稀有性、局部对比度和中央偏置等三种认知特性来预测图像中的人眼注视点。全局稀有性表明人通常会被图像中稀有的事物所吸引而自动过滤冗余的经常看到的信息;本文通过计算图像各像素点的自信息来建模该认知特性。局部对比度表明人会被不同于周边环境的事物所吸引;本文基于各像素点间的特征差异和空间关系来建模局部对比度。中央偏置表明人容易被出现在图像中央的事物所吸引;本文根据高斯函数计算各像素点与图像中心像素点的空间关系来建模该特性。现有的显著性检测模型一般使用简单的求平均或线性加权方法整合不同的特征。为了得到更好的人眼注视点预测结果,本文采用自适应强的神经网络算法非线性融合通过建模不同认知特性而得的初始检测结果获得最终的显著图。本文在2个常用的人眼注视点预测数据库(MIT和TORONTO)上将该方法与其他7种具有代表性的显著性检测方法进行了比较,证明了该方法的有效性。  (2)针对人眼注视点预测模型没有给出图像中显著目标的轮廓信息这一缺陷,本文提出了新颖有效的方法分别建模全局稀有性、局部对比度和中央偏置等三种认知特性,以便更好地检测出图像中的显著目标及其轮廓信息。对于全局稀有性,通过计算图像各像素点的自信息并且基于图像区域信息进行有效地去噪获得图像显著目标检测结果;对于局部对比度特性,通过建模图像区域与区域之间的对比度和有效的区域一致性操作获得显著目标检测结果;对于中央偏置特性,通过计算图像各像素点与中心像素点的空间关系并且基于图像区域信息进行区域平均化操作来检测图像中的显著目标。这三种认知特性的检测结果经过非线性融合得到最终的显著图。本文在6个具有代表性的显著目标检测数据库(MSRA1000、MSRA10K、iCoseg、ECSSD、SOD和PASCAL-S)上将该方法与其他7种具有代表性的显著性检测方法进行了比较,验证了该方法的有效性。  (3)针对先前基于简单图的显著目标检测工作并未重视图构造的问题,本文对简单图构造进行了深入的研究。为了得到一个适用于显著目标检测问题的简单图,本文基于三个重要的视觉认知特性:空间邻近性、特征相似性和中央偏置特性进行构造:将图像的各超像素定义为简单图的节点,根据空间邻近性和特征相似性连接空间相近或者颜色相似的节点获得简单图的一部分边,根据中央偏置特性两两连接图像边缘点获得简单图的另一部分边,使用颜色欧几里得距离和本文提出的正弦空间距离计算图中边的权重。在构造合适的简单图之后,采用基于简单图的排序算法检测图像中的显著目标。本文在6个显著目标检测数据库(MSRA1000、MSRA10K、iCoseg、ECSSD、SOD和PASCAL-S)上将该方法和11种具有代表性的方法进行了比较,证明了该方法的有效性。  (4)针对简单图不能完全表示出图像中所有信息这一问题,本文将基于超图的排序算法引入到显著性检测领域,并采用非正则化概率超图排序算法在图像中检测显著目标。现有基于图的方法一般使用简单图来进行显著性检测,简单图表示了两两节点之间的二阶关系,然而一幅图像中不仅包含两两节点之间的二阶关系也包含多个节点之间的高阶群组关系。由于概率超图能够很好地表示节点间的二阶和高阶关系,本文使用概率超图融合空间邻近性、特征相似性和中央偏置等认知特性来更全面地表示图像信息:根据空间邻近性,为超图中每一个节点构造一条空间超边,这条空间超边由这个节点作为超边的中心节点和这个节点的空间邻居节点组成;根据特征相似性,为超图中每一个节点构造一条颜色超边,这条颜色超边由这个节点作为中心节点和这个节点在颜色空间中的邻居节点组成;根据中央偏置特性,为每个位于图像边缘的节点构造一条边缘超边,边缘超边由这个节点作为中心节点和其他位于图像边缘的所有节点组成;一个节点属于一条超边的概率和这条超边的权重根据记录节点间相似度的关联矩阵而得;该关联矩阵根据颜色欧几里得距离和正弦空间距离计算而得。在构造出一个更全面表达图像信息的概率超图之后,本文采用非正则化超图排序算法对图像中的显著目标进行检测。本文在6个具有代表性的显著目标检测数据库(MSRA1000、MSRA10K、iCoseg、ECSSD、SOD和PASCAL-S)上将该方法与15种具有代表性的方法进行了比较,验证了该方法的有效性。
其他文献
该文对作者亲自参与设计、调试的VTD(Video Traffic Detect)2000系统做了全面描述.该系统主要应用于城市交通监控中心,对引入监控中心的交通监控有线电视信号进行实时处理,得
该文不采用立体视觉,而是通过对单台摄像机散焦图像的分析和计算来进行目标物体的深度估计,并进一步对运动目标的深度估计和跟踪进行研究.首先该文介绍了一些计算机视觉中常
图像分类的核心是如何学习高效、鲁棒、判别力强的表示特征。性能优良的表示特征可使得后续分类任务变得极为简单。但因图像内容极为复杂,易受遮挡、光照、尺度、形变等因素影
本文旨在设计一种基于木材干燥等复杂控制对象的控制器,以此为核心对JBGZ—1.8小型木材干燥窑建立神经网络模型,单神经元自适应PID控制算法设计与模型测试,硬、软件设计及系统实
胶囊内窥镜作为一种新型的消化道疾病检测手段,具有无痛、无创、无交叉感染、使用方便等优点,已广泛应用于临床。然而,现有的胶囊内窥镜产品仍存在一些缺陷,阻碍了该技术的临床价
该论文分两部分研究了奇异H控制问题.首行,探讨了正常系统奇异H控制问题的处理方法,总结了仍存在设计问题.其次,对描述系统、描述系统扩展H控制方法进行了深入研究,得到 证明
图像分辨率是图像细节分辨能力的衡量指标,表示图像中目标景物的细微程度与图像信息的详细程度。高分辨率图像的边缘、纹理等细节特征不仅给人以赏心悦目的感受,而且有利于机器
空间在轨交会是载人航天技术中的关键问题之一,是目前航空控制理与实践中的难点之一.该文研究了空间在轨交会的远距离和近距离控制中有关控制策略、控制方法以及测量信号处理
该文的工作具体包括以下几个方面:1.对经典的VSC进行了广泛的研究;2.研究了不确定系统的VSC设计;3.研究了离散滑模变结构控制;4.研究了VSC在实际工业系统中的应用;5.提出软到
该课题主要承担了如下几方面的工作:提出了捷联式三轴稳定跟踪的数学模型,解决了由运动目标信号和载体姿态信号到三轴的坐标变换,实现了在运动载体上跟踪运动目标的跟踪技术;