论文部分内容阅读
目标检测是自动地从图像或者视频中发现并定位指定类别的目标,这项任务是计算机视觉和模式识别领域的研究热点。目标检测的研究不但对于计算机视觉、模式识别、图像处理等学科的发展具有重要的推动作用,而且在公共安全、家庭娱乐和商业办公等方面具有广泛的应用前景。因此,本文针对目标检测问题开展研究,将目标局部形状信息的特征表示方法作为具体的研究方向。本文选择从这个方向研究目标检测问题主要基于以下三点考虑: (1)特征表示方法对于目标检测器的精度与速度具有极大的影响,是整个检测系统中十分重要的一个环节,因此本文研究特征表示方法。 (2)形状信息是一类目标最显著、最稳定的信息,为区分目标与背景提供了关键的信息,同时受外界光照、类内颜色和纹理变化等因素的影响较小,因此本文研究形状信息的特征表示方法。 (3)目标局部形状比其全局形状更加简单,因而容易为其局部形状设计简单高效的表示方法,而且局部形状特征对真实场景下的边缘缺失以及遮挡等情况比较鲁棒,因此本文研究目标局部形状信息的特征表示方法。 为了准确高效地表示真实场景下的目标形状,本文在研究目标局部形状信息的特征表示方法时着重考虑以下三个关键问题: (1)特征的判别能力:目标检测是一个两类分类问题,设计局部形状特征最基本的目标是鲁棒地区分目标与背景。因此,理想的局部形状特征应既能鲁棒地适应目标形状的类内变化,又能有效避免与混杂的背景产生误匹配。 (2)特征的描述能力:除了判别能力,局部形状特征还应具备对局部区域内的形状信息的描述能力。因此,理想的形状特征应该能够准确地描述目标的轮廓形状,进而在区分目标与背景的基础之上勾勒其轮廓。 (3)特征提取(或匹配)方法的计算复杂度:目标检测器为了定位目标通常需要从图像中提取大量的特征,因此特征提取(或匹配)的计算复杂度直接影响了目标检测器的效率。为了获得快速的目标检测器,局部形状特征应该具备高效的特征提取(或匹配)算法。 本文对局部形状特征以及基于此设计的目标检测方法逐步深入地开展研究,研究工作的主要内容以及贡献可以归纳为以下三方面: (1)局部区域内基本形状元素的表示方法:尽管不同目标的形状具有很大差异,但是它们的局部区域内的形状都可以近似地表示为一些基本的几何形状,如直线段或者弧线段。这部分以车辆为例研究局部区域内基本形状元素的表示方法,提出了一种条带特征用以直观准确地表示车辆部件的基本形状信息,并且为该特征设计基于积分图的快速特征匹配算法。此外,针对条带特征的选择问题提出了一种在常用的层级式分类器的框架下权衡特征计算效率和特征判别能力的方法。 (2)局部形状特征的变形方法:不可变形的局部形状特征很难准确表示类内形变较大的目标(如马、长颈鹿)。这部分从增强条带特征对形变的适应能力入手,为条带特征设计变形方法,提出一种可扰动的条带特征。该特征能够在局部区域进行微小扰动以获取最佳匹配结果。此外,这部分还采用自动从训练数据中学习变形规律的方法替代按照人工经验设计的变形方法,提出一种主动轮廓片段特征。该特征可以通过主成分分析从训练数据中学习局部区域内的变形规律,因此对目标形状的类内变化具有较强的鲁棒性。实验表明,基于自动学习得到的变形方法比按照人工经验设计的变形方法具有更强的形状表示能力,因此能够更精确地定位出目标窗口,并更精确地勾勒出目标轮廓。 (3)局部形状特征组合方法:局部形状特征可能会错误地匹配到真实场景中频繁出现的背景边缘上。组合局部形状特征可以编码更大范围内的形状信息,是减少上述误匹配的有效手段。因此,这部分提出了两种局部形状特征的组合方法。第一种方法是将主动轮廓片段在马尔可夫链的约束下链接起来描述图像中连续的长轮廓,因为图像中连续的长轮廓往往是属于目标轮廓的显著部分,它们对于目标与背景有较强的区分能力。第二种方法是受到格式塔心理学中相似性原理和接近性原理的启发,提出将平行的、接近的以及在训练样本上共现的两条主动轮廓片段组成轮廓片段对。轮廓片段对不但可以表示目标的轮廓形状,还能预测目标的前景区域。实验表明,上述两种局部特征组合方法都能较好地表示目标的形状。基于上述两种组合特征的目标检测器不但能够定位目标的窗口,而且能够勾勒出目标的轮廓形状。此外,基于轮廓片段对的目标检测器还可以进一步分割出目标的前景区域。 综上所述,本文按照由不可变形特征到可变形特征、由单个特征到组合特征、由检测单类目标(车辆)到检测多类目标、由定位目标窗口到定位目标轮廓和分割目标前景等多条线索逐步深入地开展对目标局部形状信息的特征表示方法的研究工作。实验表明,本文的研究工作能够按照预期目标不断地改进和完善目标检测器的性能。基于本文方法构建的目标检测器在定位目标窗口、定位目标轮廓以及分割目标前景这三项任务中均取得不错的效果。