论文部分内容阅读
随着人工智能和计算机性能的快速发展,图像数据处理变为计算机视觉中的研究重点。其中行人检测可以运用在诸如交通监控,人机交互,智能驾驶,行为分析等领域,具有广阔的应用前景。但在现实生活中行人经常受到光照变化,形变,遮挡等诸多因素影响,而且行人数据集有限,导致人工选择的特征提取困难,行人检测变得更有挑战性。另外人类虽然积累了大量图像样本数据,但这些数据是无标签的,人工标注效率低下,传统聚类算法效果差。针对这些问题,本文的研究工作主要包含以下内容:(1)实现了多特征融合的行人检测。针对单一的特征无法准确描述行人特性,采用多特征融合的方式来提取行人特征。本文选取行人的关键区域后,提取其HOG(Histogram of Oriented Gradient,HOG)特征和Uniform LBP(Uniform Local Binary Pattern)特征,然后根据这两种特征对于行人的识别能力强弱设置权重系数,自适应加权融合为一个特征向量,最后利用SVM(Support Vector Machine)分类器进行检测。在公开行人图像数据集上,采用该算法进行实验,实验说明提出的方法与传统单一特征方法相比,准确率和速度更高。(2)提出一种基于多通道输入的稀疏卷积神经网络行人检测算法。人工提取特征一般从原始数据出发,需要借助专家领域知识,对数据进行深入分析,这样会花费大量人力与计算资源。本文在基于卷积神经网络结构的基础上构建效果更好,使用更方便的行人检测算法,无需人工设计特征,自动学习数据特征。针对传统卷积神经网络的输入是原始图片,冗余信息多,对局部边缘和纹理的刻画不明显,本文提出了一种基于多通道输入的稀疏卷积神经网络检测算法。首先将图片HOG特征构成的HOG特征图和YUV颜色空间组成三个通道,通过卷积层提取特征,并采用稀疏自动编码器稀疏化特征,最后利用softmax分类器进行行人检测。模型充分利用图片的像素级特征以及HOG特征对于行人轮廓显著描述的优点,改善了算法的检测效率。(3)提出了一种基于特征融合的深度卷积聚类算法。由于现实生活中缺乏有标签的样本,人工标注的代价十分巨大,所以可行的方法是让机器自动对图像聚类,从而将不同类型的数据区分开,为行人检测这样的图像分类任务训练准备数据。传统深度聚类算法没有充分利用卷积神经网络的优势,也不能保护原始数据的特征局部结构。本文在DEC(Deep Embedding Cluster)的基础上,采用卷积自动编码器来进行特征学习,定义一种新的损失函数用于训练来保证聚类的每个类的中心尽可能地远,同时将编码层前一层的输出与编码层的输出融合作为需要优化的聚类特征,这样可以减少特征信息的损失,有效提高了聚类的效果。