论文部分内容阅读
随着人工智能产业技术的不断提高和平安城市建设的加快落地,视频监控系统迅速得到了普及,随处可见的摄像头为行人的识别和跟踪提供了大量视频数据。与此同时人工监控和分析海量视频数据变得不切实际,一是因为人工速度慢效率低,二是因为会耗费大量人力物力财力,因此,对行人重识别等智能视频分析技术具有迫切的需求。行人重识别是指在跨设备的情况下,使用计算机视觉技术来确定监控视频序列中是否存在特定行人的技术。由于行人图像的分辨率低、拍摄角度不统一、光照条件变化大、拍摄环境嘈杂、行人姿态千差万别等原因,使得行人重识别成为当今计算机视觉领域非常具有研究价值和挑战性的研究热点。行人重识别的研究一般分为两个方向,一是构建具有辨别性的特征向量,二是学习鲁棒的度量学习模型。本文同时从这两个方面着手,并结合深度学习和特征融合技术来设计有效的行人重识别算法。针对不同的行人重识别算法,本文分别设计了不同的行人图像特征表达方法,主要归纳为以下三种:(1)基于表征的超像素特征:由于现有的行人图像切割都使用预先设定的尺寸,无法保留图像原有的显著特性,因此,本文使用简单线性迭代聚类算法(SLIC)来自适应地剪切图像,然后对显著性较高的超像素块分别提取颜色和纹理特征来构建图像特征向量。(2)行人图像的分级表征特征:由于图像存在着全局和局部的不同信息,不同的信息不但会训练出不同的模型,而且对匹配精度的影响也有差异。所以本文设计了基于图像级的表征特征和三个代表不同人体部位的分块级表征特征。(3)表征特征虽然能够较好地区分不同的行人图像,但是却很难有效地克服由于拍摄角度、遮挡等客观因素给图像带来的噪声,因此,为了弥补表征特征的缺陷,本文还提取了基于神经网络的深度特征。度量学习已经是行人重识别研究的重要方向之一,本文则在字典学习的基础上,通过不同的方式来优化其在行人重识别上的应用。基于顶推思想的启发,本文提出了基于最小负样本约束的字典学习算法,该方法在最小化类内距离的同时,通过约束最小负样本的稀疏编码来扩大类间的距离,从而学习到稳定且有分辨能力的字典模型。另外,在本文的第二个行人重识别算法中,通过进一步对字典学习做出改进,提出了基于字典和投影矩阵的联合学习算法。在基于最小负样本约束的字典学习算法的基础上,联合学习算法增加了约束条件和参数,通过迭代优化的方式可以同时学习稀疏编码特征和投影矩阵,有效地提高了行人图像的匹配精度。此外,目前大多数行人重识别文献中提及的特征融合仅仅是将特征进行串联,而没有考虑到特征之间的关联性,所以本文便引入了概率超图排序算法和广义判别多集合典型相关分析来对不同类型的特征进行融合,从而得到更优的样本特征。首先通过建立超边引入多行人之间的关系,然后建立多超图来融合深度特征和稀疏编码特征这两种特征,最后使用概率超图排序算法计算图像间的相似度排序。广义判别多集合典型相关分析通过引入分类信息来学习具有辨别性的特征融合投影规则,使得融合后的特征更加有利于行人重识别的任务。最后,为了验证所提算法的有效性,我们分别在三个标准数据集VIPeR、PRID450S和CUHK01上进行了实验。实验结果表明,本文提出的算法均能在行人重识别任务中达到较好的效果。