基于深度学习的实时多目标跟踪关键技术的研究

来源 :中国科学院大学(中国科学院长春光学精密机械与物理研究所) | 被引量 : 4次 | 上传用户:shishuhu45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多个运动目标实时跟踪是数字图像处理领域的关键问题,在军事、工业等领域有着广阔的应用前景。视场内待跟踪目标在图像序列中的特征表达直接影响多目标跟踪的性能,然而前景背景之间的遮挡、多个目标之间的交互问题使得提取待跟踪目标的特征表达较为困难。深度学习是一种复杂的机器学习算法,通过对样本数据的内在规律进行学习,获取样本的深层次特征,进而更好的完成对样本的解释。近几年来,得益于深度学习对图像深层次特征的挖掘,基于深度学习的图像处理技术精度得到巨大的提升,但多用于目标检测或分类等领域,在多目标跟踪任务中鲜有应用,并且多目标跟踪作为图像序列信息处理技术,对实时性的要求较高。因此,如何利用深度学习对图像信息挖掘的优势,并满足其对实时性的要求,同时提高算法的精度与速度,存在巨大的挑战。所以,开展基于深度学习的实时多目标跟踪技术研究具有很强的学术意义和实用价值。论文在对基于深度学习多目标跟踪的关键技术进行分析的基础上,分别对基于单目标跟踪增强的多目标跟踪算法、全局优化算法、运动模型以及用于数据生成的样本生成模型等关键技术进行了研究,主要完成了以下工作:1.深入研究了单目标跟踪算法,总结了对于单一目标上下文信息处理和前景背景区分的方法,分析了目前基于先检测后跟踪策略的多目标跟踪方法对于检测器结果依赖性过强的问题,提出了一种基于单目标跟踪增强的多目标跟踪算法,并在MOT Challenge 17公开数据集上进行了定量和定性分析,该方法的多目标跟踪精度达到48.9、目标标识精度达到57.0。在与该方法具有相近误检和漏检数量的算法对比中(即所处环境近似),该方法在目标标识精度和保持目标标识稳定性的最大跟踪轨迹指标较之流行多目标跟踪算法分别提升了22.2%和17%,证明了该方法能够在维持跟踪精度的情况下提高目标标识精度和保持目标标识稳定性。2.深入研究了基于回归的边框预测方法,分析了目前多目标跟踪方法对于全局信息利用的不足,提出了一种基于深度架构的回归模型与基于孪生神经网络的分类器相结合的全局优化算法,并在行人重识别数据集Duke MTMT-re ID、Market-1501和CUHK03数据集和MOT Challenge数据集上进行了该方法性能验证。该方法能够充分利用单帧中的全局信息,避免了目标数量不确定对跟踪算法复杂度的影响;并且采用基于单样本训练的孪生神经网络,规避了更新过程,避免了低置信度检测信息对跟踪过程的影响。该方法在保持目标长时间跟踪状态、应对遮挡问题以及目标交互等复杂情况有较好的效果,目标标识精度达到57.3,多目标跟踪精度达到55.4、最大跟踪轨迹达到21.3%,分别较之流行在线算法提高3.6%、9.2%,目标标识交换降低27.9%。3.深入研究了基于循环神经网络的运动模型,分析了目前普遍采用的常速度模型在多帧环境中对目标运动估计存在的不足,提出了一种基于循环神经网络的目标运动模型,而后对该方法在MOT Challenge 17训练集和测试集上进行了目标运动趋势预测和替换更新策略的实验验证。通过将该方法整合到本文提出的多目标跟踪算法中,表征长时间跟踪性能和处理遮挡能力的目标标识精度指标分别提升2.5%和3%,目标标识交换指标分别降低21.4%和15.9%;并且更换为多帧更新策略后,集成了运动趋势预测模型的两种多目标跟踪算法能够在跟踪性能未受影响的前提下,运行速度分别提高229%和400%。4.深入研究了数据生成方法,分析了现存的数据集中样本特性。针对多目标跟踪环境样本多样性和数量匮乏的问题,提出了一种基于条件变分自编码器-条件生成对抗网络的生成模型,并利用行人重识别等数据集对生成模型的性能进行验证,实验结果表明本方法能够利用两种模型的优点,提高生成结果的质量。对于在线更新的方法,生成模型作为丰富训练空间的重要手段;而对于离线训练的方法,该模型能够作为训练集数据生成的方法对跟踪算法进行优化。将数据生成方法引入本文提出的多目标跟踪方法中进行了性能验证,在利用该方法对数据多样性进行扩充后,能够有效减少两种方法受可能出现的形变和遮挡的影响,具体表现在漏检数量分别减少3.1%、4.8%,身份标识交换分别降低22.5%、18.3%,该方法能够有效的丰富多目标跟踪数据集的样本多样性,降低复杂环境对算法效果的影响,有效提升多目标跟踪方法整体的跟踪性能。本论文针对现阶段多目标跟踪的关键技术研究中存在的不足,分别从提高长时间跟踪稳定性、通过全局优化提高跟踪精度、提高运动模型精度减少算法计算成本和提高数据样本多样性保证算法稳定性等方面,提出或改进了适合多目标跟踪任务的算法,进而对提出的算法进行了大量的仿真实验验证。实验结果表明,本文提出的方法能够有效针对多目标跟踪任务中的各项关键技术提升算法的跟踪性能。
其他文献
加入WTO以来,我国的对外贸易发展十分迅速,但同时与其他国家的贸易摩擦也逐渐增多。作为贸易救济手段的反倾销不仅对中国的出口产业也对进口产业产生了重要影响。入世10周年,
信息技术与教育的融合带来了微课这种新兴的数字化教学模式,基于微课的优势及其在高职院校机械基础课程教学中发挥的作用,笔者对课程设计开发及应用进行了思考,本文将呈现笔
本文通过列举宏观数据来详细分析了我国房地产业融资现状、存在的问题和多元化融资的必要性。进一步选择万科地产为案例对象,分析了万科近几年的资本结构、举债能力以及万科
鸡粪是红富士苹果生产中使用最为广泛的肥料之一,它不仅能增加土壤的有机物含量,而且对于改善土壤结构和理化性质、提高土壤肥力水平具有十分重要的作用。本文主要介绍了鸡粪
污染排放信息是环境决策的重要依据。分析了北京市水环境质量的现状,基于最新源排放清单,解析北京市当前主控污染物COD、氨氮排放的结构特征和空间特征,以期为北京市开展基于
文章着重于研究企业社会责任与社会绩效、经营绩效之间的关系,研究上市公司社会责任信息披露与公司价值的相关性。公司社会价值是公司价值的重要组成部分,因此,公司要与利益
行政腐败作为公民社会的一大公敌,直接影响到政府的公信力、执行力乃至合法性问题。它是行政系统内部权力运行异化的一种外显,与行政生态中的政治生态、经济生态、文化生态有
为聋生提供竞争条件下的自主经营式支持性就业与创业,是提升聋生自身价值和生活质量的重要环节,具有深刻的实践意义。但在我国残疾人就业率低下的情况下,聋生要自主创业还存
文章综合运用营销学、广告媒体研究的相关理论和方法,采用层次分析方法对企业使用多种电视广告媒体形式创造顾客价值进行了决策分析,为企业选择电视广告媒体创造顾客价值的合
<正>"老吾老以及人之老",随着人口老龄化浪潮的到来,养老问题成为社会高度关注的民生热点问题。在此背景下,西城区人大常委会持续聚焦养老问题,在深入开展调研基础上,通过执