论文部分内容阅读
随着人工智能的快速发展,行人检测在视频监控、机器人导航、车辆驾驶辅助系统等众多计算机视觉领域上有着广泛应用。在多场景数据分布不同的情况下,把在一个场景中训练性能优越的检测算法应用到新环境时,易受到拍摄角度、复杂环境以及行人姿态等因素的干扰,导致其性能显著下降。本文受迁移学习,深度神经网络,稀疏编码及背景差分法在行人检测中成功应用的启发,提出基于迁移学习的视觉行人检测方法。本文的研究内容如下:1.提出一种基于特征优化与背景差分的行人检测算法。首先设计通用检测器,对传统的梯度直方图(Histogram of Oriented Gradient,HOG)结合支持向量机(Support Vector Machine,SVM)算法进行优化,联合HOG和局部二进制模式(Local Binary Pattern,LBP)进行特征提取,检测目标场景的初始样本集。然后,采用改进的混合高斯模型(Gaussian Mixture Model,GMM)背景差分法检测目标场景中的运动区域。实验结果表明,改进的背景差分法可以快速有效地检测出远距离行人目标,从而丰富目标样本。2.提出一种基于稀疏编码的迁移学习方法,解决样本选择过程中,稀疏编码为获得精准的重建原始信号而选择无关或者差异大的原子,导致分类器不能有效学习分类面的问题。该方法通过添加局部性约束,使相似特征的编码具有相似性,实现适合目标场景的少量源样本的迁移。通过改进的结构性稀疏编码对不同样本重新分配权重,训练得到最终分类器。在多个测试集上进行实验,结果表明该算法能够适应不同的场景,具有较强的鲁棒性。3.提出一种深度稀疏自编码网络(Deep Sparse Auto-Encoder Network,DSAEN),解决传统卷积神经网络在检测中耗时长,冗余大的问题。首先通过研究行人固有的属性,优化非相邻和相邻特征描述子(Nor-neighboring and Neighboring Features,NNF)去捕捉行人轮廓的对称性特征和行人内部、行人与背景之间的差异性特征,为HOG和LBP提供丰富的补充信息。然后,从激活函数设计、损失函数设计、稀疏性设计等方面来构建新的目标函数去学习深层自动编码器网络,获得图像的结构特征。4.提出一种基于深度网络的迁移学习行人检测方法,解决少量训练样本学习的过拟合问题。首先设计源域的网络模型S-DSAEN,然后将源域训练好的网络迁移到目标域的新网络中,并对网络结构进行优化和微调,充分地利用空间信息去训练分类器。实验结果表明,迁移后的深度稀疏自编码网络节省了深度网络模型的训练时间和计算资源,在准确率和检测速度上有明显的改善。