论文部分内容阅读
随着公共安全越来越受到国内外的重视,视频监控被广泛采用并成为主要的安全监控手段。传统的视频监控系统面临着监控代价大、看不清等问题,智能化、高清化成为未来视频监控的必然发展方向。目标跟踪是智能监控中的基础性问题,复杂拥挤环境给目标跟踪带来的主要挑战是:(1)复杂背景和相似外观的目标对被跟踪目标造成干扰,(2)拥挤环境造成目标之间频繁的相互遮挡,(3)作为主要跟踪目标的行人具有高度的非刚性形变,(4)视频分辨率低造成细节信息丢失,区分目标困难。本文针对这些关键问题进行了深入的研究,主要的研究工作及创新点如下:1.提出了一种基于共享字典学习的单目标跟踪算法。在复杂拥挤的环境下,为了解决相似背景干扰的问题,该算法学习三个字典:目标字典、背景字典和共享字典。目标字典和背景字典学习目标和背景不同的部分,共享字典学习目标和背景相似的部分。通过共享字典的学习将目标和背景的相似之处与不同之处分开,使得字典具有更好的辨别能力。实验结果表明,与现有的跟踪方法对比,本文提出的算法能够更好地解决相似背景干扰的问题,在主要包含相似背景挑战的视频中,跟踪结果的平均重叠率提升了10%。2.提出了一种基于分块多图排序的单目标跟踪算法。在复杂拥挤的环境下,为了解决目标之间频繁相互遮挡的问题,该算法充分利用样本之间的流形结构关系,将目标划分成图像块,基于不同图像块的不同特征表示构建不同的关系图,每个关系图分配一个权重,同时学习关系图的权重和候选样本的排序得分,减少遮挡目标块的影响。实验结果表明,与现有的跟踪方法对比,本文提出的算法能够更好地解决目标遮挡的问题,在主要包含目标遮挡挑战的视频中,跟踪结果的平均重叠率提升了8%。3.提出了一种基于多层目标表示及多层几何关系限制的单目标跟踪算法。在复杂拥挤的环境下,为了同时解决目标遮挡和形变的问题,该算法将目标进行多层分块表示,并通过分层树模型建模目标块之间的结构关系,在统一的目标函数中求解所有目标块的位置。目标函数考虑了目标块的外观得分和目标块之间的形变损失,在允许目标发生一定形变的同时,通过多层目标块之间结构关系的限制,使得目标块的跟踪更加地准确。实验结果表明,与现有的跟踪方法对比,本文提出的算法能够更好地处理目标遮挡和形变的问题,在主要包含目标遮挡和形变挑战的视频中,跟踪结果的平均重叠率提升了9%。4.提出了一种基于静态摄像头和动态摄像头信息双向融合的单目标跟踪算法。在协同视频监控中,为了获取感兴趣目标的高清图像,提升动态摄像头中感兴趣目标的跟踪效果,该算法通过多观测模型提升单摄像头中跟踪算法的稳定性,并进一步通过信息双向融合,充分利用动静摄像头的信息提升感兴趣目标跟踪的效果。真实场景中的仿真实验和实际系统中的实验效果证明了本文提出的算法的有效性。5.提出了一种新颖的融合静态摄像头和动态摄像头信息的多目标跟踪算法。在协同视频监控中,静态摄像头中目标分辨率低,造成多目标跟踪中目标ID交换。为了解决这个问题,该算法通过动态摄像头中的高清图像信息学习更有辨别能力的外观模型,并将异质摄像头中的信息融合到基于关联的跟踪框架中,提高静态摄像头中的轨迹片段连接的准确性。实验结果表明,和现有的多目标跟踪算法对比,该算法能够大幅减少多目标跟踪中ID交换的数量,提升多目标跟踪的效果。