论文部分内容阅读
随着人工智能和计算机视觉的发展,视频中目标跟踪这一领域得到快速发展,尤其是人体多目标跟踪。人体多目标跟踪在交通管理、自动驾驶和机器人导航等领域有着广泛应用。尽管国内外研究人员在目标跟踪领域取得不错的成绩,但是当视野范围较广、感兴趣目标较多或者目标之间存在严重遮挡的时候,制约了目标跟踪的应用和发展。基于深度学习的实时目标检测和跟踪算法在人体目标跟踪中逐渐成为研究的热点。本系统采用检测和跟踪相结合的算法进行人体多目标跟踪,主要研究内容如下:(1)首先详细介绍YOLO_V3目标检测算法原理。YOLO_V3是一种实时端到端的深度学习目标检测算法。YOLO_V3在YOLO和YOLO_V2的基础上进行了改进。首先使用K-means聚类优化检测模型的先验框,然后使用新的网络结构Darknet-53作为特征提取的骨干网络,其次利用多尺度特征进行对象检测,并且使用多个独立的逻辑分类器代替Softmax函数分类。YOLO_V3无论对于大目标还是小目标都能实现很好的检测,使检测效果更优。(2)本文采用改进YOLO_V3算法进行目标检测,用Gaussian模型对网络输出进行建模,能够输出每个预测框的可靠性。Gaussian YOLO_V3和损失函数重构可以通过减少训练过程中噪声数据的影响并预测定位不确定性来提高检测的精度,此外,通过使用这种预测的定位不确定性可以进一步提高目标检测的准确度。(3)本文采用Deepsort算法进行目标跟踪,Deepsort是在Sort算法基础之上进行的改进。Sort是一种实用的方法,以简单有效的算法为重点,用于多对象跟踪,但是,Sort算法不能很好地处理遮挡问题,因为所采用的数据关联度量仅仅是基于运动信息的关联。仅在状态估计比较稳定的情况下才是准确的。本文集成了外观信息以提高Sort的性能。通过将关联度量替换为结合了运动和外观信息更全面的度量,而且应用了经过训练的Cosine深度网络,以区分大规模人员重新识别数据集上的行人。由于这种扩展,能够处理遮挡情况下的目标跟踪,从而有效地减少了身份切换的次数。(4)最后,本文根据实际应用需求,设计并实现了基于改进YOLO_V3结合Deepsort的多目标跟踪系统。实验表明系统高效稳定,可以满足实际的应用需求。