论文部分内容阅读
随着城市不断发展,城市化水平不断提高,人们越来越关注城市安全问题。借助“天网工程”完备的视频监控体系,公安干警可以借助影像资料追溯嫌疑人和走失人员,并还原出轨迹路线。但如果仅依赖人工,需要消耗大量精力在寻找和分辨行人身份上,极大地降低效率。而行人重识别任务正是在给定查询行人图像的前提下,在视频数据库中搜索并返回若干个最可能是该行人的结果,从而快速检索匹配行人身份。但该任务面临的困难包括多拍摄场景下的行人外观姿势变换,不同模态下客观存在的模态鸿沟和特征检索时可能存在的维数灾难。本文通过对现阶段行人重识别问题几个热点方向的总结,从多模态行人特征提取和加速特征检索方法两个角度入手,主要研究工作如下:(1)单模态行人重识别特征提取网络模型研究对于单模态下的行人重识别任务,本文提出了一种基于多层次的部位切分网络(Multi-level Slice-based Network,MSN)。它的基础结构是双分支结构,分别是全局特征提取分支和局部特征提取分支,两个分支都利用了不同层级中的多层次信息,并结合所切分的不同区域。实验证明,提出的MSN在几个主流的单模态数据集上取得出色的效果,证明了网络设计和联合目标函数的有效性。(2)跨模态行人重识别特征提取网络模型研究对跨模态的行人重识别任务,本文提出一种基于通道Zero-padding的MSN。对输入做通道Zero-padding处理后,跨模态网络可以由单流输入结构MSN表征。联合损失函数的设计使网络能够克服模态鸿沟。实验证明,提出的基于通道Zero-padding的MSN在多模态数据集上取得较出色的效果,证明了网络设计和联合目标函数的有效性。(3)加速行人重识别特征检索方法对于加速特征检索,本文对应用了K-D树和乘积量化倒排索引的两类方法进行分析,基于K-D树的特征检索方法是精确检索,但是特征维数会影响检索效率,并且树结构所占空间大小并未减少甚至增加;而基于乘积量化倒排索引的方法由于量化误差的存在,在准确度上会下降,但是它在缩短检索时间上提升很大,并且量化后的编码特征所占空间大大减小。实验证明,上述两类方法能够大大缩短行人重识别特征检索时间。