论文部分内容阅读
随着智慧城市、信息社会的建设和治安防控、打击犯罪的需求,越来越多的监控摄像头在各个场景、社区被投入使用。日益增多的摄像头同时产生了海量的视频数据,而且视频数据通常只能人工梳理,在面对大量视频数据场景下人工梳理方式代价高昂且效率低下。为了解决这个问题,本文针对行人检测、行人再识别任务进行研究,并设计实现了一套重点区域出入口人员分析系统,将非结构化的视频数据进行结构化处理,方便进行查询和梳理。首先,本文在CenterNet目标检测算法基础上,提出了 PAP(Persons as Points)行人检测算法。该算法遵从CenterNet思想,将行人检测看作行人中心点定位问题,在定位基础上增加两个分支用于尺度的回归和定位偏差的回归。并针对行人数量、尺寸做了一些改进的后处理策略和边界框预测策略。在CityPersons数据集上和项目组收集BUPT3000数据集上进行了测试,结果证明算法满足实时检测的任务需求。其次,本文在 PCB(Part-based Convolutional Baseline)行人再识别算法基础上,改进提出了 MV-PCB(Multiple view PCB)行人再识别算法。该算法基于PCB的工作,改用了更加强大的特征提取网络,同时增加了一个从多视角关注全局特征的分支,弥补了 PCB只关注局部特征而忽视全局特征的不足。在Market1501数据集上,MV-PCB算法比PCB有1.1%的Rank-1准确率和7.9%mAP提升。最后,本文在行人检测算法和行人再识别算法的基础上,设计并实现了一套重点区域进出口人员分析系统。系统能够对目标行人在下辖摄像头内进行跨摄像头的追踪,也能够根据下辖摄像头纪录并持久化存储的数据查询行人的历史信息。通过测试表明,本系统能够有效的对监控摄像头进行长时间检测,将视频数据处理成结构化的行人特征信息并保存,同时进行提供实时的行人跨摄像头追踪和历史信息查询功能。