论文部分内容阅读
计算机视觉的一个核心任务就是识别图像中所包含的一系列有实际意义的物体(如人、飞机等),它是对该幅图像做出进一步解释和理解的基本前提。如何提取有效的特征来对物体进行表征和描述是视觉目标识别非常关键的一个问题。本论文主要研究在静态图像目标(特别是人脸)检测和视频中的运动目标分类问题里,提取兼具很强辨别能力和运算简单特点的视觉目标特征及其对应的目标分类和检测算法。论文的主要工作如下:
1.基于AdaBoost的目标检测框架大都基于简单的Haar特征。但是,原始的Haar特征由于描述能力较弱导致无论模型训练还是应用测试两个阶段均具有很高的运算复杂度。同时,在模型训练的后期,基于Haar特征的弱分类器分类能力太弱以致于不能提高整个检测器的性能。本文应用MB-LBP特征代替Haar特征训练人脸/非人脸分类器。MB-LBP特征(Multi-block LocalBinary Pattern)是对原始LBP特征的一种扩展。改进了原始LBP特征只能描述小范围的图像信息以及易受噪声影响的缺点。在使用AdaBoost进行特征选择和分类器构建时,针对MB-LBP特征值非度量的情况,本文设计了多叉树型的弱分类器来解决这一问题。
2.本文提出了利用MB-LBP特征和EC0C规则设计的多类别目标分类算法,并把它应用到视频中的运动目标分类问题里。本文应用基于MB-LBP、EC0C的分类器对视频中的前景图像进行分类识别,该方法可以把运动目标分类成行人、自行车、轿车、面包车等六个类别。同以前大多数方法相比,本文介绍的方法可以在各种具有不同摄像机视角和背景的视频场景中使用同一个分类器对运动目标进行分类。同时,本文的方法可以识别小轿车、卡车、骑自行车的人这样的更细致的类别。
3.在实际应用中只能从有限数目的视频场景中采集前景图像数据,提取MB-LBP特征训练分类器。在一个新的视频场景中,由于受摄像机视角、光照变化的影响,该场景中的前景目标可能同训练集里的数据存在不小的外观上的差异。这导致了所训练的基于MB-LBP特征的分类器在该场景中的分类性能有限。本文使用该分类器以及利用基于物体形状、运动信息等特征实现在各种摄像机视角下的鲁棒的运动目标分类。