论文部分内容阅读
计算机视觉中的“目标(Objects)”泛指图像中含有主要语义和视觉信息的若干区域,“似物性(Objectness)”是一种近年来提出地描述通用目标视觉共性的方法。基于似物性分析的目标区域检测(Object proposal)旨在快速、准确地给出图像中可能含有目标的若干区域,从而避免在图像中进行全尺度、全空间的穷尽搜索。该类方法不仅能够为图像检索和语义识别提供更好的视觉基元,而且也是许多基于深度学习的计算机视觉任务的重要环节,例如目标识别、图像描述。然而,自然图像中目标区域存在很大的外观、姿态差异,且数量、尺度、位置未知,如何在图像中快速而准确地进行目标区域检测是当前一个重要的研究问题。 现有的目标区域检测方法可以分为基于滑动窗口打分的方法和基于超像素聚合的方法。基于滑动窗口打分的方法能够高效地输出目标大致的矩形区域,但是无法得到准确的目标轮廓。基于超像素聚合的方法能够自适应的得到具有较好边缘的区域,但是该类方法往往依赖复杂的分割算法,且输出的结果中包含许多非目标的背景区域。此外,大多数结构化的目标存在部件组成上的共性规则,是一种十分有效的似物性度量信息,而该部分信息往往未被有效利用。 为了解决上述问题,本文从边界准确性、前景显著性和结构一致性三个方面对基于似物性分析的目标区域检测进行深入的研究,旨在提出定位准确、显著性高、灵活性强的目标区域检测方法。本文主要贡献如下: 提出一种基于语义边界保持的目标区域检测方法。针对传统的基于超像素聚合的目标区域检测方法输出的区域数目过多,且存在过/欠分割的问题,本文在超像素分割SLIC方法像素与种子点距离度量中,考虑连线上语义边界的影响,使超像素分割区域更好地贴合实际目标区域的边界。此外,本文引入区域边界闭合率的概念,自动地在超像素聚合过程中选取少而有代表性的视觉一致区域。实验结果表明该方法在Berkeley图像分割数据集上比SLIC方法具有更好的边界准确性,并且检测得到的区域在多种图像变化下具有良好的鲁棒性。 提出一种基于自适应背景预测的显著目标区域检测方法。与前景区域相比,图像的背景区域往往比较简单,该方法从背景区域建模出发,进行高质量的显著目标区域检测。首先采用一种快速的似物性估计方法对图像的背景信息进行预测,然后在此基础上使用背景颜色对比度、背景连接度以及空间分布三个背景先验来度量图像显著性。该方法有效地避免以往基于背景先验的显著目标区域检测方法因目标出现在图像边缘而导致检测失败的问题,并得到均匀一致高亮的显著目标区域。实验结果表明该方法在MSRA10K和ECSSD两个标准数据集上超过其它11种显著性检测方法,且计算效率高。 提出一种基于部件关联学习的目标区域检测方法。基于全局信息的目标区域检测方法容易受到背景、遮挡的干扰,而基于部件的目标区域检测方法具有更好的灵活性。现有的方法已经能够对部件进行较为准确的识别,但是部件之间的关联关系建模仍然没有得到很好的解决。人体是一种典型的结构化目标,因此本文以人体为例,探讨如何利用部件之间的关联关系进行高效的目标区域检测。首先,提出利用部件连接来建模部件之间的关联关系,从检测结果图中可以直接推导出候选部件的归属。然后,根据部件连接可靠性的不同,推导得出基于最小生成树的人体部件解析算法,极大地减少运行时间。实验分别在2个单人数据集和3个多人数据集上进行了对比实验,结果表明本文提出的方法在提高目标区域检测准确性的同时,还能减少运行时间的花费。 总之,本文提出的基于似物性分析的目标区域检测方法是在深入分析现有方法不足的基础上展开的,从不同的角度对该任务进行有益的探索,为高层的图像理解和分析提供了良好的基础,具有广泛的应用前景。