论文部分内容阅读
作为计算机视觉中的一大研究领域,行人检测技术在最近几年已经赢得了越来越多关注的目光。行人检测的主要目的是要把图片或视频场景中的行人与背景进行区分,并确定行人在图像中的位置。传统的行人检测方法主要是通过提取图片中行人的大小、形状、纹理、颜色等外观信息,并结合一定的先验条件来判断图片中是否有行人。然而传统的行人检测方法由于使用单一、不稳定的特征,其判别能力并不是很高。随着梯度特征和多分类器的引入,行人检测的算法无论是在速度上还是在准确度上都有了新的提高。本文主要针对基于梯度特征和多分类器的行人检测方法展开了研究,主要研究内容包括以下几点:图像梯度特征的提取与多特征的融合。在行人检测算法中,会经常用到Edgelet、Shapele、类Haar等生物特征,考虑到这些特征容易受到行人姿势变化以及不同行人个体间多样性等因素的影响,在特征提取阶段本文选取了图像的梯度特征来描述行人性质。同时,考虑到行人的大小及远近不同,提取了金字塔图像的梯度特征。最后,考虑到单一特征的片面性,本文中首次将金字塔梯度方向直方图特征和金字塔中心对称局部二值模式这两种特征相结合,组建了多特征。基于Bagging算法的行人检测方法。Bagging算法可以将不稳定弱分类器学习算法的分类性能明显地提高,非常适合并行运算,大大缩减了训练多分类器的时间。在Bagging算法的决策阶段,所用到的基本分类算法分别是KMSE算法和SVM算法。考虑到在多分类器进行集成的过程中集成的速度及规模问题,本文提出了一种删除最差基本分类器的Bagging剪枝方法,相对于原始的Bagging方法,这种基于剪枝的方法在分类精度上有了一定的提高。基于后验概率的行人检测方法。常见的两类分类器中,通常采用简单的阈值来表示最终的分类结果,这在后期多分类器融合的过程中可能会带来很大的干扰。通过使用后验概率,如果某单一分类器对边界点不能决策出其所属类别,那么就将该样本移交到其他的分类器来做进一步判断,同时,这个分类器也要提供对该样本的一些决策信息作为最终多分类器融合的分类参考,这种方法取得了不错的分类效果。