论文部分内容阅读
随着近些年来平安城市战略的启动,在硬件方面,越来越多的高清摄像机出现在城市的各个地方。尤其是重点的公共场合以及重要卡口领域,这些地方的监控摄像机数量更加庞大。每当在一个城市发生危机事件之后,往往需要调取周边环境的海量监控数据,并从多个摄像机的监控视频画面中寻找出来可疑目标人物。然而,这些海量的监控摄像机安装在各个地方且跨度很大,这就导致了需要花费大量时间以及人员精力从这样海量的监控中寻找到该可疑目标。如何从这些跨场景的监控画面中快速、有效的找出可疑目标是安防领域面临的巨大挑战和难题。 本文主要对监控视频场景下的行人进行研究。由于行人是柔性物体,因此,在不同的摄像机下经过的行人姿态变化巨大,同时由于安装的监控摄像机的角度、分辨率不一致以及不同场景带来的影响都导致了行人识别准确率较低的问题。面对这些难题,本文采用基于深度学习的卷积神经网络模型获取表达能力更强的图像特征,实现在监控场景下的跨场景行人识别。其主要贡献有: 1、采用一种基于自适应空间特征的深度行人识别卷积神经网络。该方法首先根据行人特征空间分布的特点将行人图片在空间上划分为多个图像块;其次,使用多分支卷积神经网络分别自适应的提取各个行人图像块的深度特征;最后,通过计算行人图像深度特征的相似度判别行人图像对是否属于同一人。该方法能够自适应提取行人各个区域的深度特征,并取得良好的行人比对准确率。 2、采用一种基于多分块三重损失计算的深度行人识别网络,来解决行人识别准确率不高的问题。具体来说,本文采用一种多分块三重损失计算的方式来对提取的特征进行反馈计算。 (1)三个行人图像输入到分割层当中,各自分为上中下三块,并在对应的网络当中进行特征提取; (2)在经过两层卷积层提取行人特征之后,每一个行人的上中下三块都有对应的三重损失计算,并根据损失值进行反馈调节; (3)将所有的行人图像进行融合,并继续在网络当中训练,通过分类器进行分类输出,在测试当中根据输出值判别行人对是否属于同一个行人。该方法在公开库数据库当中与其他传统方法相比有较高识别准确率。 3、采用一种基于深度特征的跨场景行人以图搜图方法。该方法以一个实际场景下的行人作为检索目标,对另一个实际场景下的所有行人进行对比。计算出行人图像之间的相似度进行统一排名,若检测目标能在排名结果中的前N名(TOPN),则认为该目标命中。统计所有命中目标个数作为最终结果,经过测试发现该方法在真实监控场景下依然取得了较高的行人识别准确率。