论文部分内容阅读
人工智能领域近年来得到了快速的发展,这得益于计算机处理能力的提升以及先进的机器学习算法。因此,在许多使用传统算法难以解决的问题,使用人工智能算法都逐步地被解决。一直以来,行人识别问题都面临着传统算法难以解决的困难,如光照、遮挡、背景变化等问题。使用单一的算法在多变的环境下提取行人的特征也是很难实现的。由于基于机器学习的算法能够通过学习训练来获得对外界变化适应的能力,因此,本文提出使用机器学习中卷积神经网络和循环神经网络的方法对指定行人进行识别。首先,对于行人视频中的一帧,本文采用提取行人姿态的方式来定义一帧的特征。而对于一个人的姿态是通过16个关节点(右踝、右膝盖、右臀、左臀、左膝、左踝、盆骨、胸部、脖子、头顶、右手腕、右手肘、右肩、左肩、左手肘、左手腕)定义的。因为通过此种方法提取特征可以减弱行人穿着、背景变化以及光照等因素的影响。采用的方法是使用卷积神经网络对人体各部分进行识别,并且将该识别的区域通过热图的方式找到最佳能代表该部分的点。此外,由于训练数据集中对行人身体被遮挡的部分也有标注,所以本算法对于部分遮挡情况也有一定的识别能力。其次,对于行人的特征,本文采用一系列视频帧中行人的姿态特征(走路姿态或步态)表示。这种方式属于基于时间序列化特征提取的问题,采用具体方法是使用有一定记忆功能的循环神经网络来实现的。根据视频帧的顺序,每一帧的姿态特征作为循环神经网络一个时刻的输入,而循环神经网络会根据自身的参数选择所记忆部分以及遗忘的部分,如此经过多帧的迭代,得到最终的输出,即为行人的特征。最后,本文使用上述算法实现了一个行人识别的系统,其中系统包括一个行人定位模块,是采用梯度直方图与支持向量机的原理。这是因为本文的姿态识别算法只能识别人物位于图像中央的图片。因此对于实际应用场合中可使用行人定位模块找到该行人再对其进行姿态提取。本系统通过建立行人数据库,进行特征比对,从而实现了行人识别的基本功能。