基于时空信息嵌入的多目标跟踪方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zhangmin6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智慧城市的推进,大量监控摄像机被部署于机场、火车站、社区等公共场所,形成多级别、多类型的全覆盖监控摄像机网络,从而提供了数以万计的大规模监控视频。随着监控视频数据的日益增加,传统的人工监控方法由于实时性差、检测分析不全面等缺陷难以处理大规模的监控视频数据。因此,基于机器学习、模式识别和计算机视觉的智能化视频分析技术具有重要的应用价值和研究意义。智能化视频分析技术对监控摄像机中获取的视频数据进行智能化处理,对面向不同应用需求的实体目标及其行为进行结构化分析整理,形成便于查询的结构化数据。多目标跟踪作为实现监控视频智能化分析的关键技术,旨在获取监控视频中所有运动目标的位置信息与身份信息。多目标跟踪任务可以为行为分析、动作识别等高层视觉任务提供有效信息,因此受到了研究学者的广泛关注。随着目标检测及行人重识别等底层视觉任务的发展,多目标跟踪任务也随之取得了丰硕的研究成果。然而真实场景下的多目标跟踪任务仍然面临着巨大的挑战,例如目标局部遮挡,特征不稳定,检测误差,光照变换等。上述挑战一方面由于目标检测误差造成目标特征无法对齐从而影响识别精度,另一方面因为有效信息的丢失、背景信息的干扰、局部细节的缺失增加目标特征学习的难度,从而进一步影响多目标跟踪的性能。除了真实场景的复杂多样性之外,多目标跟踪任务在技术层面也面临着模型无法端到端优化的挑战。具体而言,非端到端模型面临着优化困难、难以部署、误差累积等问题。本文首先针对单摄像头多目标跟踪任务中的检测误差、特征不稳定及无法端到端优化问题展开研究。具体而言,本文以视频中丰富的时空信息为基础,分别学习视频中的时空拓扑约束与时空轨迹关联,探索如何基于轨迹时空信息构建端到端多目标跟踪模型。进一步地,针对跨摄像头场景中的局部遮挡问题,建模基于姿态信息的局部匹配。本文的主要工作和创新点可以总结为以下四个方面:1.基于时空拓扑约束的多目标跟踪算法。在视频的多帧序列中,遮挡目标的检测与匹配是构建目标运动轨迹的难点。但是,多目标跟踪数据集提供的公开检测结果中存在大量由于遮挡带来的误检与漏检问题。因此,如何引入额外信息调整检测结果是多目标跟踪算法亟需解决的问题。针对上述问题,本文提出了基于时空拓扑约束的多目标跟踪算法。该方法首先通过方向、速度、空间距离等信息将目标及邻域目标构建为社交拓扑矩阵。其次,基于人群运动中的统计分布一致性通过空间拓扑约束来消除人群运动轨迹中的异常目标。最后,基于连续运动目标中的时域一致性通过时间拓扑约束来恢复连续帧中的漏检目标。2.基于时空轨迹关联的多目标跟踪算法。已有的算法利用基于图片帧的视觉特征进行数据关联来缓解遮挡匹配问题,而忽略了轨迹中包含的丰富时空上下文信息。为了更好的利用轨迹时空信息缓解遮挡问题,本文提出了一个基于时空轨迹关联的多目标跟踪算法。该算法首先通过时空注意力网络捕捉每条轨迹内部的显著区域以生成具有判别力的轨迹特征,然后将不同轨迹之间的时空关系建模为一个可靠的度量函数来生成高质量的轨迹从而增强多目标跟踪匹配的准确性,最后提出了双向插值算法利用轨迹的运动信息恢复已匹配上轨迹之间的丢失目标。3.基于轨迹特征增强的端到端多目标跟踪算法。针对已有多目标跟踪算法无法端到端优化,从而导致多目标跟踪各个模块相互独立、误差累积的问题,本文提出了一个基于轨迹特征增强的端到端多目标跟踪算法。该算法首先基于图匹配方法构建身份关联分支,将其与目标检测、特征提取整合到一个网络中,从而实现模型端到端优化的目标。然后基于历史轨迹信息建模轨迹增强模块桥接目标检测、特征提取与身份关联三个模块,同时基于历史轨迹信息增强目标检测与特征提取的底层特征,从而在整个网络中形成互利互惠的正反馈循环。4.基于光流姿态匹配的多摄像头多目标跟踪算法。目标局部遮挡与快速运动是多目标跟踪任务面临的挑战。考虑到现有方法在挖掘目标全局特征描述的同时忽略了局部特征对遮挡目标匹配的有效性,本文提出了一个基于光流姿态匹配的多摄像头多目标跟踪算法。该算法首先获取相邻帧之间的光流信息与每帧图片中的目标姿态信息,其次基于目标运动的连续性利用光流信息调整之前帧的姿态信息从而减少由于快速运动引起的空间距离误差,然后基于目标之间同时检测到的关键点信息计算局部姿态相似度,从而缓解遮挡带来的难匹配问题。通过将目标全局视觉特征、全局空间特征、以及局部姿态特征相结合,可以进一步增强数据关联鲁棒性,提升多目标跟踪的准确率。
其他文献
期刊
乡村振兴战略是新时代做好“三农”工作的总抓手,人才振兴是乡村振兴的关键所在。涉农高校是开展乡村人才培养的主要载体,主要利用高校师资队伍、专业知识和技术、培训场所等教育教学资源,开展多种形式、多个层次的乡村人才培养。广西涉农高校积极参与服务乡村振兴,开展乡村人才培养,成效显著,但也存在人才培养与市场需求脱节、各层次人才培养断层明显、毕业生就业引导不足、短期培训缺乏考评机制等问题。建议通过加大教育教学
期刊
卫星导航干扰检测技术是抗干扰技术的基石,其核心在于寻找接收的卫星导航信号和外界干扰二者的特征差别。时频分析技术作为卫星导航干扰检测技术的核心手段,无疑在卫星导航干扰检测领域占据重要地位,但时频分析方法的一些固有缺陷同时也限制了卫星导航干扰检测技术的发展,因此本文在前人工作和总结的基础上,针对卫星导航接收机容易被扫频干扰影响而不能正常工作以及传统时频分析方法中时频分辨率、交叉项干扰等限制因素,将分数
学位
目的 比较4种衰弱工具对老年癌症患者衰弱风险的筛查能力,为临床衰弱筛查工具的选择提供参考。方法 采用目的抽样法,选取308例住院老年癌症患者为研究对象,采用老年-八项问卷、弱势老年人调查-13问卷、简明老年人综合评估问卷、衰弱表型和老年综合评估工具进行衰弱评价。以老年综合评估结果为衰弱诊断金标准,通过Bayes判别分析和受试者工作特征曲线分析比较4种筛查工具筛查老年癌症患者衰弱风险的能力。结果 老
期刊
图划分作为面向图数据的经典问题,被广泛用于分布式图处理、社区发现、图像分割、道路规划等领域。在图划分问题中,将图中的节点或边均匀地划分至不同分区,以减少跨分区边或节点的数目是图划分的主要目标。但随着现实生活中图数据规模不断增大,如何在仅基于局部图信息、内存消耗较低的情况下针对不同场景中的各类型图数据进行图划分操作成为亟需解决的问题。本文针对不同类型的图数据(静态图、动态图、权重图)提出了不同的局部
学位
人体目标检测作为计算机视觉领域的一个重要研究方向,旨在对图像中每个人体目标实例进行准确定位,并通过矩形框来表示其位置及边界。近年来,因其在高层视觉研究和下游实际任务中具有重要的作用,人体目标检测获得了学术界和工业界的广泛关注。一方面,人体目标检测是各种高层视觉研究的基础,如行人跟踪、行人重识别和行为识别等。另一方面,人体目标检测也为大量的下游实际任务提供核心支持,包括智能监控、自动驾驶和人机交互等
学位
图像超分辨率重建是指利用给定的低分辨率图像恢复出高分辨率图像的过程,是一类关键的计算机视觉或图像处理技术。该技术不仅是单独的低级视觉任务,它还可以作为其他计算机视觉任务的预处理过程,在公众安全、遥感卫星图像、医学图像、视频显示等大量图像相关领域广泛应用。一般来说,图像超分辨率(Super-Resolution,SR)重建任务非常具有挑战性并且本质上是病态的。因为如果确定降质模型后,从高分辨率(Hi
学位
青藏高原察尔汗盐湖区属于典型的高寒干旱气候区,是“一带一路”辐射范围内氯盐渍土分布最广地区。随着交通强国建设下新一轮西部大开发的深入推进,该地区交通基础设施建设规模逐渐扩大。在长期交通荷载作用及青藏高原气候暖湿化趋势影响下,高寒盐湖区道路出现大量由于氯盐渍土不良工程特性导致的翻浆、沉陷、不均匀沉降等路基病害,严重威胁着盐湖区公路长期稳定性与运营安全。因此,开展交通荷载下高寒盐湖区氯盐渍土路基变形特
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种主动微波成像系统,具有全天时、全天候成像的特点,在军事和民用领域发挥着重要作用。SAR图像分类是SAR图像解译的关键环节。然而,由于SAR图像具有地物纹理复杂、存在类内多样与类间相似、标记样本少等特点,导致基于传统特征提取的方法分类性能受到限制。近年来,随着深度学习的发展,卷积神经网络(Convolutional Neu
学位
手语是一种基于视觉的语言,它为聋哑人士提供了交流的媒介。手语翻译与生成技术研究与计算机视觉、自然语言处理、跨媒体计算以及人机交互等多个前沿研究领域密切相关。早期的研究者致力于离散手语动作的识别,其研究可以追溯到30多年前。近年来,由于深度学习技术的发展,越来越多的工作开始关注于连续手语翻译和手语视频生成。虽然一些最新的研究技术在手语研究中取得了广泛的成功,但手语翻译与生成研究依然面临着诸多困难与挑
学位