论文部分内容阅读
多摄像机目标跟踪是计算机视觉领域重要任务之一,其应用十分广泛,特别是在智能视频监控中。近年来,随着人们对社会安全关注的提高,以及越来越多的摄像头开始出现在世界范围内各个城市,人们对智能视频监控的要求也越来越高。而作为其中的核心问题之一,多摄像机目标跟踪也引起了越来越多研究者的注意。如何设计一个实用的多摄像机目标跟踪算法牵涉到很多方面的问题,包括目标检测,单目标跟踪,单摄像机多目标跟踪,跨摄像机多目标跟踪等。而其中的每一个环节又有着很多的问题和难点。本论文旨在建立一套完整的多摄像机目标跟踪算法,并对其中几个环节中重要的问题点进行针对性的研究,提出对应的改进方案,具体研究如下: (1)在多摄像机目标跟踪过程中,由于检测结果数量过多,会大大降低之后数据关联过程的速度和准确率。因此我们首先对每个目标进行简单的单目标跟踪,得到初始轨迹片段。但是,现今的单目标跟踪方法很难保证跟踪的准确率,而错误的轨迹片段会对之后的多目标跟踪产生严重的影响。为了保证跟踪的准确率,我们提出一种基于自适应的多特征融合的单目标跟踪方法。该方法通过学习各种特征在跟踪过程中的稳定性,动态的选择最稳定、最适合跟踪的特征,来主导跟踪过程。同时,我们根据当前预估的跟踪准确率去实时地控制特征的更新,一定程度上解决了跟踪的漂移问题。在ICCV2013年举办的单目标跟踪竞赛中,我们的跟踪方法在所有27支队伍中取得了准确率第四名的成绩。 (2)在得到初始轨迹之后,主流的多摄像机目标跟踪方法会分成单摄像机目标跟踪和跨摄像机目标跟踪两个步骤,分别对这两部分进行独立处理。在这种情况下,如果单摄像机跟踪中存在误差,那么在之后的跨摄像机目标跟踪中该误差将被进一步放大,从而影响最终结果。本文提出一个基于均衡化的全局图模型结构来实现多摄像机目标跟踪,该方法将单摄像机目标跟踪和跨摄像机目标跟踪放在一个图模型中进行统一优化,克服了分别优化所带来的误差放大问题。同时,现今多摄像机目标跟踪研究尚未形成一个统一的评价准则和公共数据集。我们提出了一个指标更加清晰的评价准则,并在此基础上公布了一个更有代表性的数据集。 (3)在完成整个多摄像机目标跟踪体系之后,发现,对多摄像机目标跟踪影响最大的部分就是跨摄像机中的特征匹配过程。把该问题抽象出来,则是一个经典的行人再识别问题。很多现今主流的方法将行人再识别看成一个分类问题或者排序问题来处理。我们通过探究两者之间的关系,发现两者之间的互补性。因此,提出了两种融合方式对两者进行有效融合:1)我们提出了多任务深度网络来同时优化分类和排序两个问题;2)我们设计了一个四元组损失函数,该函数既包含了分类和排序损失函数中的优点,又一定程度上避免了其各自存在的不足。我们的两种方法在公开数据集上都达到了优于之前方法的效果。