论文部分内容阅读
深度学习是机器学习领域中比较新兴的方向,很多研究者相信通过对它的研究,可以达到机器学习的一个本质目的——人工智能。本文主要研究了如何将深度学习应用于行人重现检测技术。该技术主要解决了如何将两段视频或两组图片中的行人按照身份进行匹配的问题。参照行人重现检测的一般思路,本文的工作分为两个方向:一个是研究如何将深度学习应用于行人图片的特征提取;另一个是构建可以用于距离度量学习的深度模型。 本文使用DBN这一典型的深度模型,通过多种方式对行人图片提取深度特征,并对其进行分析和改进。通过将行人图片进行划分为条带或小块作为DBN的学习数据,降低了图中形状轮廓的复杂度,使本文提取出的深度特征能很好的包含了颜色、纹理等信息,这个工作为深度特征在复杂视觉问题中的应用提供了思路。除此以外,本文通过深度特征训练出了人体视角分类器,可用于对行人图片进行视角估计。通过提取多种视角下的平均深度特征,本文制作了多个可以用于不同视角下的人体背景分离模板。利用视角分类器及背景分离模板,可以比较便捷的提取出用于行人重现检测的有效特征,减低了特征提取这一环节的复杂度。 在另一个研究方向上,本文从一种特殊的深度学习模型——关系深度模型出发,具体分析了这种模型的结构、性能及作用。通过对FRBM这一典型的模型进行大量改进,包括模型结构及学习方法,本文提出了可用于行人重现检测中的距离度量学习的模型——MFRBM。实验证明,MFRBM在多个行人重现检测数据库上的性能要优于部分现有的方法。