基于深度学习的多目标跟踪关联模型设计

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:gwj19861113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多目标跟踪(Multi-Object Tracking,MOT)旨在从视频或者连续的图像序列中得到多个感兴趣目标完整的运动轨迹。作为计算机视觉和模式识别领域的一个研究热点,MOT为后续的视频分析和理解提供了基础,在智能视频监控、无人车驾驶、人机交互、医学诊断、精准制导等诸多领域具有广泛的应用前景。虽然近年来多目标跟踪算法研究取得了很大的进展,但是受复杂的跟踪场景变化、频繁的遮挡、目标个数不确定性等因素的影响,多目标跟踪算法研究一直是一项极具挑战性的课题。近年来,随着深度学习在计算机视觉领域取得的突破性进展和检测器性能的不断提升,基于检测的跟踪算法已经成为当前多目标跟踪的主流方法。这类方法的基本流程如下:首先由训练好的离线检测器提供每一帧中各目标的位置(即检测响应),然后将多目标跟踪问题转换为数据关联问题,将属于同一目标的检测响应关联在一起,最终得到完整的目标轨迹。因此,关联模型的设计是该类跟踪算法的核心。关联模型主要用于计算检测响应(或者轨迹片)之间的关联亲密度,一个好的关联模型能够提取具有判别性的目标特征,在反映不同目标差异性的同时保持相同目标之间的共同性,从而实现对复杂场景中多个目标的鲁棒跟踪。本文采用基于检测的多目标跟踪框架,结合深度学习技术,对多目标跟踪关联模型的设计进行深入的研究。主要工作如下:(1)基于深度度量学习的多目标跟踪关联模型设计行人多目标跟踪任务和行人再识别之间具有相似性,基于此相似性,本文首次将行人再识别中的三元组损失应用于多目标跟踪领域。通过三元组约束关系构建三元组训练样本,采用三元组损失训练一个三通道卷积神经网络提取目标外观特征;通过判别性的外观特征计算目标之间的外观相似度,再结合线性运动模型计算轨迹片之间的关联概率;最后使用自适应时间滑动窗机制和匈牙利算法进行多级关联,得到完整的目标运动轨迹。在MOT Challenge数据库上的实验证明了该算法的有效性。(2)基于特征融合和度量学习的多目标跟踪关联模型设计目标运动模式和跟踪场景具有不确定性,比如目标运动方向发生突变、运动速度发生变化、摄像头发生剧烈抖动等。在这些情况下,简单的线性运动模型无法提取到准确的目标运动特征。针对此问题,本文提出用递归神经网络建模目标非线性运动模式并提取运动特征,在此基础上融合目标外观和运动特征,提出基于特征融合和度量学习的多目标跟踪关联模型,实现了端到端的神经网络模型设计。在MOT Challenge数据库上的实验结果证明了该方法的有效性,取得了与当前主流算法相当或者更好的多目标跟踪结果。(3)基于递归神经网络和贝叶斯滤波的多目标跟踪算法当前基于检测的多目标跟踪算法大都关注于如何实现可靠的数据关联。但另外一方面,检测器输出质量也将影响多目标跟踪算法性能。针对目标检测器常见的漏检、虚警以及定位不精确等问题,本文提出了一种轨迹估计策略以校正检测器缺陷:我们设计了一个基于循环神经网络(RNN)的贝叶斯滤波子模块,并嵌入到基于LSTM的运动特征提取模块;以LSTM网络的隐状态变量为输入,RNN网络通过预测、更新实现目标状态更精准的定位。实验结果证明,将轨迹估计策略与上述关联模型相结合,可以进一步提升多目标跟踪算法性能,同时显著改善了跟踪目标的定位精准性。
其他文献
属性约简作为邻域粗糙集的关键技术,其主要思想是在不影响决策系统分类能力的基础上,将冗余的、不相关的条件属性删除。由于属性约简被证明是一个NP-hard问题,传统属性约简算法搜索空间较小,往往不能得到更小的约简集合,而与群智能算法结合的属性约简算法有着更大的搜索空间,能够得到更小的约简集合,因而研究更高效、更快速的群智能属性约简算法成为属性约简领域的主要研究课题之一。本文提出一种基于改进鱼群算法的邻
能源作为国民经济和社会发展的重要战略资源,对现代经济的发展起到了至关重要的作用,但由于能源的粗放消耗方式,给环境带来了巨大压力。目前,环境与资源之间的矛盾日益突出,而河南省作为我国重要的经济大省和人口大省,在其经济社会发展的进程中,同样也受到能源与环境的双重压力,如何提高能源的利用效率,降低污染物排放,实现能源、环境与经济三者协调发展,成为河南省未来社会发展的重中之重。论文从河南省城市能源效率与环
精准扶贫、信息化扶贫是当前我国扶贫工作的重要指导思想。互联网时代和大数据时代的到来为各行业的发展提供了机遇,同时也为扶贫工作的信息化提供了契机。当前,计算机技术应用于贫困户扶贫,主要体现在三个方面:第一,应用计算机系统有效管理扶贫信息,提高办事效率,加速扶贫进程;第二,利用大数据处理技术高效统计分析数据变化、数据指标;第三,利用机器学习技术,对贫困户数据做分类识别或预测,协助帮扶人员决策。虽然计算
猪流感病毒(Swine influenza virus,SIV)属正黏病毒科,流感病毒属,该病毒引发的猪流感(Swine influenza,SI)是一种急性呼吸系统传染病,传染性极强,并且常与猪的其他传染病并发,增
如何快速、准确地从海量网络数据中找到有用的信息,已经成为必须面临的一个重要问题。短文本聚类作为一种信息处理方法,成为挖掘数据信息的重要手段之一。针对传统聚类算法处理具有“长尾现象”的短文本时存在特征信息不足,特征维度高,小类别信息丢失的问题和针对如何解决传统聚类算法在处理网络短文本时严重忽略短文本的外在特征导致聚类结果精度不高的问题,提出了两个不同类型的短文本聚类算法:(1)针对“长尾现象”短文本
董家河煤矿进入二水平回采过程中,煤层厚度通常变化较大,导致一个回采工作面内常赋存有薄煤带,进而引起回采工艺的设计、推采速度等回采技术参数发生改变,顶板岩层移动及围岩
刑事法律援助是指在刑事诉讼过程中,出于保护那些有着法律服务的需要,但在经济上缺乏寻求法律服务的能力的犯罪嫌疑人、被告人以及特殊案件的当事人的合法权益,由负有法律援助责任的机构和人员依照法律法规的相关规定,将无偿的法律帮助提供给当事人的制度。这项制度是犯罪嫌疑人、被告人辩护权的重要保障,其是否完善,直接关系到犯罪嫌疑人、被告人的合法辩护权能否有效实现。从我国刑事法律援助制度的理论研究来看,主要包括:
贵金属纳米结构的局域表面等离激元共振(局限于贵金属纳米结构的电荷密度的集体振动)在光学和光电子学领域的研究中具有重要意义。该共振非辐射弛豫产生的热电子可以跃过金属
吴凡是新中国现实主义版画的代表性艺术家,他的水印木刻作品充分汲取中国传统文化精髓,以清新淡雅、含蓄委婉取胜,极具底蕴,富有诗意。探寻吴凡水印木刻艺术特色,将理论与实
二氧化碳(CO2)作为碳一家族中最为廉价、无毒且丰富的资源,将其有效的资源化利用并转化成具有高附加值的精细化学品,已成为广大学者的研究热点之一。众所周知,CO2是一种热力学