论文部分内容阅读
在自动驾驶、智能视频监控、人机交互等现实应用的驱动下,利用计算机视觉技术对环境特定目标进行检测、识别和跟踪,已经成为学术研究的热点需求和重要方向。而在环境目标中,行人是最受关注的类别之一,近年来行人检测问题的研究进展十分迅速,并得到了工业界的初步应用。行人检测的核心是一个关于背景与行人的二分类问题,其难点在于背景以及行人受尺度、遮挡等影响产生的丰富变化对行人检测器产生了干扰;为应对这些变化,论文从特征提取与分类算法两个方面开展研究,具体如下:第一,提出了使用线性判别分析选择的自相似特征。以自相似特征为基础,针对其维度与基特征维度呈平方关系,难以运用于高分辨率特征图的问题,利用线性判别分析,从所有自相似特征中提取对背景与行人具有良好的类间区分性与类内不变性的特征,降低了自相似特征维度。该方法计算高效,易于扩展,所得特征在直观上具有物理合理性。实验结果表明,使用该特征训练的行人检测器在Caltech数据集上的对数平均漏检率达到13.96%。第二,提出了使用尺度相关池化特征与软决策树的行人检测算法。以多分辨率滤波通道为基础,针对不同尺度行人特征感受野不对应的问题,提出尺度相关池化特征,使得特征感受野随检测尺度的不同而变化;针对特征不满足尺度不变性的问题,提出利用软决策对不同尺度的行人予以分治。实验结果表明,以上两种算法配合高效的滑动窗分类方案,在Caltech数据集上可以达到13.84%的对数平均漏检率,同时检测速度达到20.15帧/秒。第三,提出了使用分层多姿态学习的遮挡行人检测算法。以多姿态学习算法为基础,针对行人遮挡模式众多,单独处理复杂度过高的问题,提出“胞体—部件”的分层结构。该结构利用不同遮挡模式之间存在相互交叠的特点,使得决策树能够被不同的部件检测器所共享。算法在训练样本的遮挡模式未知的情况下,自动为不同的遮挡模式训练部件检测器,并且在训练过程中降低遮挡部分的权重,从而降低这部分特征对分类器的干扰。实验结果表明,使用分层多姿态学习算法训练的检测器在Caltech数据集上对严重遮挡的行人检测达到62.87%的对数平均漏检率,优于使用普通提升树训练的检测器。论文研究了行人检测中特征提取与分类算法两项关键技术,通过对自相似特征,多分辨率滤波通道,多姿态学习的优化,丰富了行人检测算法处理行人与背景变化的手段。研究结果为提高行人检测系统的实用性提供了借鉴和参考。