论文部分内容阅读
随着智能汽车、智能监控和多媒体技术的不断发展,行人检测研究受到越来越多的关注。行人检测也就是利用智能化手段,从图像或视频中自动的识别出行人,通过计算机视觉、数字图像处理等相关技术,能够在计算机上实现行人检测。但是现在行人检测技术仍不够完善,同时也存在着许多不利检测的难点,例如复杂的背景,角度的不同,光照的变化,非刚体轮廓变形等问题。这些难点使行人检测在实际应用中不能达到很好的效果。本文在综合分析国内外已有的行人检测方法基础上,利用行人特性,提取相应的融合特征,并用基于行人结构的稀疏表示对融合特征进行稀疏学习,从而提高行人的检测率。具体包括如下内容:
(1)提出一种基于融合特征的行人检测方法。该方法在统计学习的基础上,充分考虑到人体部位所有具有的特殊性,来进行行人图像的梯度方向直方图(HistogramsofOrientedGradient,简称HOG)、颜色和纹理融合特征的提取,其中颜色、纹理特征分别采用颜色频率特征和Tamura提出的纹理特征的粗糙度、方向度和对比度三种属性。在提取融合特征时,将行人图像按块均分,分别提取相应的三种特征,然后进行归一化处理,并将其串联成块内融合特征向量,接着将所有块融合特征向量串联组合成整幅图像的融合特征向量,最后训练支持向量机(SupportVectorMachine,SVM)分类器,进行行人识别。该方法充分考虑到了行人的形状、颜色和纹理信息,能够更加准确的检测出行人。
(2)提出一种基于行人结构的稀疏表示算法。该方法通过分析由平滑凸损失和惩罚函数两部分组成的稀疏表示优化问题,通过改变惩罚函数的构成来将图像的结构信息加入到稀疏表示中,然后根据行人图像的内部结构特性,在GroupLasso的基础上,将行人人体根据整体和局部的特征按组划分,并将这些划分的组构成一个4层多叉树,该多叉树同一层次的节点之间是互不重复的,而其中非根节点属于它的父节点,将这种多叉树结构通过稀疏表示的惩罚项加入到稀疏表示中,构造出基于行人结构的稀疏表示,从而使该稀疏表示更加有利于行人的检测。
(3)提出一种基于行人结构稀疏表示的行人检测方法。该方法充分考虑到稀疏表示有利于分类的特性,并结合行人图像的内部结构,利用基于行人结构的稀疏表示对行人的融合特征向量进行结构稀疏学习。在稀疏表示过程中,字典是由训练集的融合特征按照一定的排列顺序构造成的。在用稀疏化的融合特征向量训练SVM分类器时,需要训练两次SVM分类器,即初始SVM分类器和最终SVM分类器,其中在训练最终SVM分类器时,字典是用加入困难负样本后的新训练集构造成的。本文方法在行人检测中能够减少人体自身存在不利检测难点的影响,与传统方法相比具有更好的检测率和鲁棒性。