【摘 要】
:
多目标跟踪是数字图像处理和视觉领域的关键问题,包含检测识别和数据关联等多项任务,在社会生活、工业生产和军事等领域有广阔的应用前景。随着检测算法的发展,基于检测的多目标跟踪算法逐渐流行并由此产生不同的跟踪范式。其中一段式,即联合检测与嵌入的多目标跟踪范式,通过网络共享的方式将外观特征提取过程嵌入检测器中,较好的均衡了跟踪精度与跟踪效率。但该范式存在检测依赖和跟踪鲁棒性较差等问题,在线跟踪的实时性也难
论文部分内容阅读
多目标跟踪是数字图像处理和视觉领域的关键问题,包含检测识别和数据关联等多项任务,在社会生活、工业生产和军事等领域有广阔的应用前景。随着检测算法的发展,基于检测的多目标跟踪算法逐渐流行并由此产生不同的跟踪范式。其中一段式,即联合检测与嵌入的多目标跟踪范式,通过网络共享的方式将外观特征提取过程嵌入检测器中,较好的均衡了跟踪精度与跟踪效率。但该范式存在检测依赖和跟踪鲁棒性较差等问题,在线跟踪的实时性也难以保证。此外,如何在数据关联时合理利用检测结果,减少检测信息缺失对跟踪效果的影响仍存在挑战。针对以上问题,本文对基于联合检测与数据关联的多目标跟踪算法做了如下研究工作:(1)基于中心点检测的一段式多目标跟踪算法存在热力图定位偏差和外观特征图可学习范围较小等问题,导致外观特征提取过分依赖于检测精度,从而影响跟踪效果。针对此问题,提出加强重识别的多目标跟踪算法。该算法针对检测偏差问题设计检测偏差损失,通过抑制预测热力图中非真值位置的响应值大小,使高响应值向目标真值位置逼近,从而减小检测偏差对外观特征提取的影响。针对特征范围,提出可学习特征范围动态扩充策略,根据目标尺度对其在重识别特征图上的可学习特征范围做自适应扩充,从而降低特征选择对检测精度的要求。实验分析表明,该算法在MOT16和17数据集上的跟踪精度达到71.5%和70.6%,目标识别精度达到71.7%和71.0%,验证了所提算法能在不影响跟踪速度的情况下加强跟踪稳定性。(2)针对跟踪实时性、外观特征易混入背景噪声和数据关联时的检测信息遗漏等问题,提出YOLOXs-MOT。该算法利用YOLOXs解耦头的特点以极小的计算代价嵌入外观特征提取模块。针对嵌入特征易混入背景噪声的问题,提出二次筛选策略,在训练时利用标注框对预测正样本进行二次筛选,去除偏移距离较大的样本。针对检测信息遗漏问题,提出跟踪阈值分离策略。在不同的匹配过程使用不同的置信度阈值既可为相似度匹配提供高质量的外观特征,又能为Io U匹配提供更多待选边界框,使检测信息分配更合理。通过实验分析,该算法在MOT17和20数据集上的跟踪精度达到70.5%和65.1%,在移动电脑端上的在线跟踪速度达到24.4FPS和8.5FPS,验证了所提算法的有效性,在实现较高跟踪精度的同时有较快的跟踪速度。(3)多目标跟踪算法在处理目标信息缺失的问题上存在不足,容易导致漏跟和轨迹碎片化等问题。数据关联时低质量特征会影响特征匹配的稳定性,从而影响跟踪效果。针对以上问题,提出融合轨迹补偿的多目标跟踪算法。该算法在关联时对丢失目标的轨迹进行信息缺失判断,并利用轨迹预测信息对缺失信息的轨迹进行扩展,实现对缺失信息的补偿。同时提出低置信度目标特征不更新的策略,来保证特征匹配的稳定性。实验表明,该算法在MOT17和20数据集上的跟踪精度达到70.7%和65.0%,目标识别精度相比YOLOXs-MOT提升了1.2%和0.7%,轨迹命中率提升了2.5%和5%,能有效改善漏跟和轨迹碎片化问题。对多个不同关联算法和多目标跟踪算法的扩展性实验表明,所提算法在几乎不影响实时性的前提下,能有效改善信息缺失问题,且具有较强的扩展性。本文针对多目标跟踪算法存在的问题,分别从检测依赖、跟踪鲁棒性以及信息缺失等方面,提出了相应多目标跟踪算法,并对所提算法进行了大量实验验证。实验结果验证了本文算法的有效性,能针对不同问题稳定提升多目标跟踪性能。
其他文献
随着智慧城市的建设和发展,监控摄像机被广泛安装和应用,由此产生的视频数据量呈现爆炸式的增长。如何高效地利用监控视频大数据是当前的研究热点,也是亟待解决的技术难点。因此,以简短表达监控视频为目的的视频浓缩技术得到了人们的广泛关注。视频浓缩技术是将原视频中的目标进行提取和分析,采用以空间换时间的方式,消除视频中的冗余信息,但现有的视频浓缩方法存在交互性保留不精准,复杂场景下视频浓缩性能不佳以及浓缩过程
相比于传统的二维图像,光场图像(LFI)通过全光相机捕获每条入射光线的方向和位置,同时记录了场景的纹理内容和三维结构信息,在计算机视觉任务中拥有巨大优势。但是,在降雨天气采集的光场图像由于雨条纹和雨雾的遮挡,导致背景信息缺失。在低光照条件下采集的光场图像存在亮度低、噪声大等问题,导致图像质量降低。光场图像的修复与增强一直是计算机视觉领域的难点。因此,本文提出了一种光场图像去雨算法和一种低照度光场图
纳税人口企业数量的不断增加给传统的办税大厅办税的税收方式带来了极大的挑战,这就要求税务机关推出网上办税渠道电子税务局系统。由于税务信息的保密性,并且电子税务局系统需要外网环境使用,因此需要使用一种安全性更高的加密算法,来保证系统的安全性。本文主要研究的是一种能够进行一次一密加密操作的改进AES+RSA混合加密算法,并使用该算法保证电子税务局客户端系统数据传输的安全性。本文的主要研究工作如下:(1)
在当今数据大爆炸的时代,人工智能领域各种技术蓬勃发展,其中分类方法仍然是机器学习中重要的研究领域之一,机器学习中的分类方法研究在图像、语义识别等具体场景具有一定实用价值。随着移动互联网的高潮到来,数据量不断增大、数据类别不断丰富,不断提出新的应用场景需求,对传统的机器学习方法带来一定的挑战。面对多样性的数据经典分类方法无法处理好数据内在的关系,泛化性能表现不佳。因此,聚焦研究新数据应用场景下多视角
医学图像分析是当前研究计算机视觉的关键领域之一,其中医学图像分割的作用是确定感兴趣对象的二维区域或内部体素的集合,感兴趣对象一般包括器官及其子部分,这是计算机辅助检测的第一步。本文针对医学图像分割任务,基于深度学习的算法展开研究,在细胞核、肝脏和肺部图像分割数据集上进行实验,以提高医学图像分割的精度。主要研究内容包括:首先,改进一种基于卷积神经网络和编解码结构的细胞核图像分割算法(Att Inc
文本简化的目的是为了在保持文本语义不变的情况下,降低语句的复杂度,将复杂的文本转换成更易于理解的文本。文本简化主要分为词汇简化和句子级别的文本简化两个方面。传统的词汇简化算法依赖于人工标记的数据集或者只关注复杂词本身而未能有效的关注复杂词的上下文,导致生成的候选词不符合上下文语境。同时,主流的文本简化模型的性能也依赖于高质量的数据集,但是文本简化数据集较少并且数据集中的信息并不完全准确。为了解决以
随着社会的进步和科学技术的发展,在计算机视觉领域,我们采集到的图像数据相比于以前有两大明显特征:1.数据量变大;2.数据内蕴含的非线性信息变丰富。首先,数据量的变大使得基于图像集分类的方法成为可能。相比于传统的基于单张图片的分类方法,基于图像集的分类方法有更好的容错性,并且可以充分挖掘数据内部蕴含的相关信息。此外,由于传统的机器学习方法是基于欧氏空间理论的,因此难以有效挖掘数据中蕴含的非线性结构信
随着大数据时代的到来,单视图数据已经不能满足人们的需要,多视图数据应运而生。多视图数据指从多个角度或者以不同的衡量标准对同一事物进行全面描述的数据,它由多个视图组成,每个视图代表一个角度或者衡量标准。与单视图相比,多视图数据包含了更丰富的语义与更有意义的信息,因此对多视图数据进行研究是很有必要的。聚类作为无监督学习中的一项基本方法,在挖掘数据的底层信息方面表现卓绝,这正是研究多视图数据所需要的方法
受自然灾害和病虫害入侵等影响,林木内部容易出现腐朽和空洞。近年来探地雷达检测技术在树干无损检测领域兴起,其具有抗干扰能力强、检测速度快等优势,得到了研究者们的广泛关注。传统的探地雷达成像方法假设树干为圆形结构,获取半径宽时窗,用极坐标方式重建树干截面,容易导致缺陷定位偏差,检测准确度有限。本文结合信号处理、偏移算法和深度学习等研究了两种树干内部缺陷定位的成像方法,并且提出了针对活立木的多元协同检测
天波超视距雷达(Over-the-Horizon Radar,OTHR)通过高频天波在电离层的折射弯曲摆脱了地球曲率对视距的限制,其自上而下的探测模式,可以实现对隐身战机、低空飞行器等的早期预警和连续观测。目前,天波超视距雷达主要是通过多基地联合布站的方式实现对目标的高精度定位,同时该方式也提高了系统的生存能力,这对预防和打击外来侵略目标具有重要的意义。但多基地联合布站的定位方式也导致其定位模型在