论文部分内容阅读
对自然场景进行目标分割和识别是计算机视觉中一个重要的问题。人类视觉经过长时间的进化,形成了自己独特的视觉信息处理机制,为计算机视觉的研究工作提供了新的思路和灵感。本文参照人类视觉系统的工作方式,以视觉显著性理论为基础,并融合超像素分割和轮廓检测模型对显著性目标分割与识别进行了深入研究。论文的主要内容如下:第一章阐述了显著性目标分割识别研究的背景、意义和目的,对显著性目标分割识别中相关理论方法的研究现状做了归纳总结,分析了显著性目标分割识别中仍然存在的一些问题,并针对这些问题给出了本课题的主要研究内容。第二章对自然场景下多个显著性目标分割方法进行了研究,提出了利用视觉注意力转移机制对自然场景下显著性目标进行检测,并利用图分割模型对检测到的显著性目标进行分割处理。算法的主要步骤如下:首先,对图片进行层级树轮廓提取,并利用层级树中所有叶子结点作为注意力检测得到的元目标,同时对图片提取显著性图,利用“胜者为王”策略得出当前最显著目标所在位置,以该位置对应的元目标作为需要提取的显著性目标;然后,利用该元目标作为前景种子区域,根据不同参数,通过图分割对该元目标进行知觉组织,得出该显著性目标不同尺度下的多个分割结果。实验表明,对包含多个目标的自然场景,提出的模型能够取得较好的检测和分割效果。第三章针对传统轮廓提取算法效率偏低的问题,提出了 一种基于超像素的显著性目标轮廓提取算法,并将提出的显著性目标轮廓检测算法应用到显著性目标分割任务中。算法主要流程如下:首先,利用超像素分割算法对图片进行分割,并将超像素边缘进行膨胀处理,以此弥补超像素边缘和真实显著性目标轮廓之间的可能存在的定位误差;然后,对膨胀后的超像素边缘提取不同方向和尺度的局部轮廓信息,并将得到局部轮廓信息进行线性加权得出显著性目标的局部轮廓检测结果;在前面得出的局部轮廓信息基础上,建立相应的对称相似矩阵,并对其进行特征值分解得出特征值和特征向量;利用不同方向的梯度算子对前面得到的特征向量进行卷积处理得出显著性目标轮廓的全局信息;最终,将局部和全局轮廓信息进行线性加权得出显著性目标的全局轮廓。由于本章提出的算法只考虑从部分图片像素中提取轮廓信息,所以其减少了冗余计算,提高了轮廓提取的效率。实验表明,本章提出的显著性目标轮廓检测算法执行效率不仅明显高于原始的轮廓提取算法,而且同时拥有较好的显著性目标轮廓检测效果和显著性目标分割效果。第四章对原始的基于图的超像素分割算法做了改进,提出了一种效率更高的超像素分割算法,并对不同超像素算法应用于显著性目标轮廓提取时的性能进行了研究。本章以分水岭算法得出的区域作为节点建立图,得出改进后的超像素提取算法。实验结果表明,尽管算法额外包含了分水岭过程,但是其最终效率仍然优于传统的基于图片像素的超像素提取算法。当对不同超像素算法应用于显著性目标轮廓提取时的性能进行对比时,实验从两个不同的方向展开。一方面,超像素自身轮廓作为最终的显著性目标轮廓提取结果。在这种情况下,实验结果表明具有不规则形状和不同大小的超像素的性能要明显优于具有规则形状和相似大小的超像素。另一方面,不同超像素算法应用到局部显著性目标轮廓提取算法中并对显著性目标轮廓提取质量进行评价。实验结果表明,由于考虑了梯度信息,一些具有规则形状和相似大小的超像素也能取得较好的显著性目标轮廓检测效果。第五章在显著性目标分割基础上融入目标识别任务,针对每一个显著性目标不仅给出其对应的分割结果而且还要得出其相应的类别信息。模型主要流程如下:首先,利用显著性目标分割模型得出每个显著性目标多尺度的分割结果;然后,利用训练得到的多类别线性分类器,给出当前显著性目标的类别信息。具体而言,通过对每个尺度的分割结果,融入局部和全局信息提取相应的特征描述子,得出该尺度下分类器给出的类别信息。由于每个显著性目标拥有多个尺度的分割结果,每个尺度的分割结果将会按照前面的方法给出相应类别信息,最终显著性目标类别通过投票得出,得票最多的类别将会作为当前显著性目标的最终类别信息。最后,依据当前显著性目标的类别信息,利用相应类别的线性回归模型从多尺度的分割结果中选择得分最高的分割结果作为当前显著性目标的最终分割结果。实验结果表明,本章提出的模型能够较好地提取场景中显著性目标的同时能够给出其相应的类别信息和分割结果。第六章根据本文研究内容建立了一套基于仿人视觉的显著性目标分割识别系统。系统包括场景显著性图提取、视觉注意力转移、显著性目标轮廓提取、显著性目标多尺度分割和显著性目标分割识别这五个功能模块。并通过现场采集图片对建立的显著性目标分割识别系统进行了测试。第七章对全文做了总结。简要论述了本课题的主要研究内容、结论以及创新点,并对接下来的研究工作做了展望。