论文部分内容阅读
多个运动目标实时跟踪是数字图像处理领域的关键问题,在军事、工业等领域有着广阔的应用前景。视场内待跟踪目标在图像序列中的特征表达直接影响多目标跟踪的性能,然而前景背景之间的遮挡、多个目标之间的交互问题使得提取待跟踪目标的特征表达较为困难。深度学习是一种复杂的机器学习算法,通过对样本数据的内在规律进行学习,获取样本的深层次特征,进而更好的完成对样本的解释。近几年来,得益于深度学习对图像深层次特征的挖掘,基于深度学习的图像处理技术精度得到巨大的提升,但多用于目标检测或分类等领域,在多目标跟踪任务中鲜有应用,并且多目标跟踪作为图像序列信息处理技术,对实时性的要求较高。因此,如何利用深度学习对图像信息挖掘的优势,并满足其对实时性的要求,同时提高算法的精度与速度,存在巨大的挑战。所以,开展基于深度学习的实时多目标跟踪技术研究具有很强的学术意义和实用价值。论文在对基于深度学习多目标跟踪的关键技术进行分析的基础上,分别对基于单目标跟踪增强的多目标跟踪算法、全局优化算法、运动模型以及用于数据生成的样本生成模型等关键技术进行了研究,主要完成了以下工作:1.深入研究了单目标跟踪算法,总结了对于单一目标上下文信息处理和前景背景区分的方法,分析了目前基于先检测后跟踪策略的多目标跟踪方法对于检测器结果依赖性过强的问题,提出了一种基于单目标跟踪增强的多目标跟踪算法,并在MOT Challenge 17公开数据集上进行了定量和定性分析,该方法的多目标跟踪精度达到48.9、目标标识精度达到57.0。在与该方法具有相近误检和漏检数量的算法对比中(即所处环境近似),该方法在目标标识精度和保持目标标识稳定性的最大跟踪轨迹指标较之流行多目标跟踪算法分别提升了22.2%和17%,证明了该方法能够在维持跟踪精度的情况下提高目标标识精度和保持目标标识稳定性。2.深入研究了基于回归的边框预测方法,分析了目前多目标跟踪方法对于全局信息利用的不足,提出了一种基于深度架构的回归模型与基于孪生神经网络的分类器相结合的全局优化算法,并在行人重识别数据集Duke MTMT-re ID、Market-1501和CUHK03数据集和MOT Challenge数据集上进行了该方法性能验证。该方法能够充分利用单帧中的全局信息,避免了目标数量不确定对跟踪算法复杂度的影响;并且采用基于单样本训练的孪生神经网络,规避了更新过程,避免了低置信度检测信息对跟踪过程的影响。该方法在保持目标长时间跟踪状态、应对遮挡问题以及目标交互等复杂情况有较好的效果,目标标识精度达到57.3,多目标跟踪精度达到55.4、最大跟踪轨迹达到21.3%,分别较之流行在线算法提高3.6%、9.2%,目标标识交换降低27.9%。3.深入研究了基于循环神经网络的运动模型,分析了目前普遍采用的常速度模型在多帧环境中对目标运动估计存在的不足,提出了一种基于循环神经网络的目标运动模型,而后对该方法在MOT Challenge 17训练集和测试集上进行了目标运动趋势预测和替换更新策略的实验验证。通过将该方法整合到本文提出的多目标跟踪算法中,表征长时间跟踪性能和处理遮挡能力的目标标识精度指标分别提升2.5%和3%,目标标识交换指标分别降低21.4%和15.9%;并且更换为多帧更新策略后,集成了运动趋势预测模型的两种多目标跟踪算法能够在跟踪性能未受影响的前提下,运行速度分别提高229%和400%。4.深入研究了数据生成方法,分析了现存的数据集中样本特性。针对多目标跟踪环境样本多样性和数量匮乏的问题,提出了一种基于条件变分自编码器-条件生成对抗网络的生成模型,并利用行人重识别等数据集对生成模型的性能进行验证,实验结果表明本方法能够利用两种模型的优点,提高生成结果的质量。对于在线更新的方法,生成模型作为丰富训练空间的重要手段;而对于离线训练的方法,该模型能够作为训练集数据生成的方法对跟踪算法进行优化。将数据生成方法引入本文提出的多目标跟踪方法中进行了性能验证,在利用该方法对数据多样性进行扩充后,能够有效减少两种方法受可能出现的形变和遮挡的影响,具体表现在漏检数量分别减少3.1%、4.8%,身份标识交换分别降低22.5%、18.3%,该方法能够有效的丰富多目标跟踪数据集的样本多样性,降低复杂环境对算法效果的影响,有效提升多目标跟踪方法整体的跟踪性能。本论文针对现阶段多目标跟踪的关键技术研究中存在的不足,分别从提高长时间跟踪稳定性、通过全局优化提高跟踪精度、提高运动模型精度减少算法计算成本和提高数据样本多样性保证算法稳定性等方面,提出或改进了适合多目标跟踪任务的算法,进而对提出的算法进行了大量的仿真实验验证。实验结果表明,本文提出的方法能够有效针对多目标跟踪任务中的各项关键技术提升算法的跟踪性能。