【摘 要】
:
视觉目标跟踪旨在解决对视频序列中感兴趣目标的持续跟踪问题,其在许多人工智能应用中都扮演着重要的角色,例如智能监控、智能驾驶和智能交互等。虽然近年来视觉目标跟踪在跟踪精度和跟踪速度方面不断突破,但是实现一款准确性高、鲁棒性强、实时性好的通用目标跟踪器依然面临巨大挑战。一方面,稀有的先验信息给目标外观模型的离线训练带来了诸多困难;另一方面,由目标自身因素和环境因素引起的显著的外观改变使得视觉目标跟踪问
论文部分内容阅读
视觉目标跟踪旨在解决对视频序列中感兴趣目标的持续跟踪问题,其在许多人工智能应用中都扮演着重要的角色,例如智能监控、智能驾驶和智能交互等。虽然近年来视觉目标跟踪在跟踪精度和跟踪速度方面不断突破,但是实现一款准确性高、鲁棒性强、实时性好的通用目标跟踪器依然面临巨大挑战。一方面,稀有的先验信息给目标外观模型的离线训练带来了诸多困难;另一方面,由目标自身因素和环境因素引起的显著的外观改变使得视觉目标跟踪问题变得更加复杂。针对视觉目标跟踪中先验信息稀缺、目标外观多变等挑战,本文从构建鲁棒外观模型的角度出发,深入探索如何充分利用并有效结合跟踪过程中的多种视觉线索和外观信息,如时空上下文信息、多视角信息和长短期记忆信息,进行考虑多元信息的鲁棒视觉跟踪算法研究。本文的主要创新点及贡献包含以下四个方面:(1)为了对抗视频场景中杂乱背景的干扰,本文提出一种结构化上下文感知的视觉跟踪算法。该算法利用时空上下文信息来改善传统结构化稀疏模型的判别性,以此应对相似背景等挑战场景。该算法同时构建局部目标字典和局部上下文字典对目标图像块进行联合稀疏表示,并利用时空上下文信息考虑目标图像块之间的局部外观差异。根据图像块区分目标周围背景上下文的能力,提出影响因子分配策略为不同图像块分配自适应的影响因子。同时引入时间上下文信息来获取更加准确的候选似然分数计算。为了尽可能地获取视频序列中有价值的外观改变而减少背景噪声的干扰,本文提出基于结构化的字典更新机制来实现可靠的模型更新。通过结合时空上下文信息,该算法在OTB-50数据集上获得了75.3%的距离精度和54.6%线下面积分数,实现了较为理想的跟踪结果。(2)为了应对跟踪过程中目标出现的各种显著外观改变,本文提出一种基于多视角学习的视觉跟踪算法。该算法通过融合多种相互补充的特征视角来增加目标外观表达的多样性,以此应对形变及旋转等挑战场景。在目标搜索阶段,提出多视角协同策略联合稳定性衡量和判别性衡量对不同视角进行贡献评估和加权融合。在模型更新阶段,提出记忆增强的在线更新方式并设计动态且独立的学习速率来缓解模型漂移问题。在尺度估计阶段,提出歧义感知的尺度更新机制来减少不可靠的位置估计对尺度估计的不利影响。该算法在OTB-50数据集上获得了82.9%的距离精度和62.9%线下面积分数,实验结果表明该算法实现了良好的跟踪性能。(3)为了缓解模型漂移问题,本文提出一种基于双重记忆选择模型的视觉跟踪算法。该算法通过同时保持目标外观的短期记忆信息和长期记忆信息来平衡外观模型的自适应性和稳定性。所提出的双重记忆选择模型由短期记忆跟踪器、长期记忆跟踪器、记忆评估准则和记忆选择器组成。短期记忆跟踪器强调目标的近期改变,用来应对快速形变视频场景。长期记忆跟踪器保留目标的历史状态,用来处理杂乱背景视频场景。记忆选择器完成长短期记忆信息的有效融合,它根据记忆评估准则自适应地选择擅于处理当前视频场景的记忆跟踪器结果作为最终的输出。此外,引入时间上下文信息来获取更加稳定的目标运动轨迹。该算法在OTB-50数据集上实现了86.5%的距离精度和66.4%线下面积分数。此外,实验结果表明该算法能够显著增强相关滤波类跟踪算法处理形变和杂乱背景挑战因素的能力。(4)为了处理长时目标跟踪问题,本文提出一种基于时空可靠性评估的长时目标跟踪算法。该算法包含相关滤波跟踪器、粗到精重检测器和输出整合器来提供一个鲁棒的长时跟踪框架。所提出的基于时空可靠性评估的长时跟踪框架通过结合时空上下文信息来提供更加准确的重检测输出和可靠性评估。在该框架中,重检测器采用由粗到精的检测策略来改善不可靠的跟踪输出。输出整合器进一步对相关滤波跟踪器和粗到精重检测器的输出可靠性进行仔细评估和有效融合以获取更加准确的目标位置。该算法在OTB-50数据集上实现了87.3%的距离精度和67.1%线下面积分数,实验结果证实了该算法的有效性和优越性。
其他文献
单原子催化剂是多相催化研究的前沿,目前其活性组分多为贵金属,研制性能优良的非贵金属单原子催化剂尤为必要。M-N-C(M=Fe,Co,Ni等)是典型的非贵金属单原子催化剂,在氧还原等电化学反应中表现出可媲美Pt/C的催化活性,但在热催化反应中研究较少。本论文选取芳香硝基化合物选择性加氢为探针反应,以研制高活性、高选择性的非贵金属单原子催化剂为目标,通过创新方法制备了一系列M-N-C单原子催化剂,并用
本论文采用大量宏观农户调查与多年、多点不同区域主栽作物田间肥料效应试验相结合的方法,基于2004-2006年和2014-2016年两个时间段共计3602个农户施肥状况的调查,研究我国农户复合肥施用现状与变化,并结合宏观统计数据分析研究复合肥行业的发展方向。通过2001-2006年和2008-2014年两个时间段的293个田间肥料试验,对不同工艺复合肥进行农业效果评价;通过2002-2006年和20
博弈论是研究理性决策者之间冲突与合作的数学模型,它可以用来建模和分析一些大规模的优化问题。在博弈的框架下,每个博弈者根据所设计的分布式策略调整其决策变量到纳什平衡点处,进而实现优化各自目标函数的目的。就目前而言,分布式纳什平衡点搜索算法往往是在博弈者目标函数的数学模型确定的情况下以及博弈者之间能在通信网络上进行信息互换的基础上设计的。然而,在实际问题中,博弈者目标函数可能会受到不确定因素的影响,从
氮氧化物(NOx)作为一种主要的大气污染物,对人类健康及环境有较大危害,如何有效脱除NOx已经成为研究者广泛关注的热点课题。氨选择还原法(NH3-SCR)被广泛应用于贫燃柴油机尾气和固定源烟气中NOx的消除。其中,针对移动源尾气中NOx的消除,Beta分子筛负载Fe催化剂是一种具有较好活性的NH3-SCR催化剂,但是由于尾气中存在的烃类化合物(如丙烯)会在Beta分子筛酸性位上聚合并形成积碳导致催
高熵合金(High-entropy alloys)由等摩尔或近等摩尔比例混合的多个主要元素构成,并具有简单晶体结构,包括体心立方(BCC)、面心立方(FCC)及其有序超结构(B2、L12)等。其中,Al和过渡族金属(TMs,Transition Metals)组成的BCC基Al-TMs系高熵合金的微观组织对Al含量敏感,极易出现BCC固溶体相与有序B2相共存,且形成网状调幅分解组织,会严重降低合金
当前网络生活已经成为人们现实日常生活中必不可少的部分,加强网络治理,营造风清气正的网络环境是亟需完成的目标。网络道德治理作为网络治理的重要组成部分越来越成为全球互联网治理的发展趋势和迫切需要攻克的时代课题。党的十八大以来,习近平总书记提出了一系列关于网络治理的新思想,以推进网络空间命运共同体为目标,促进网络生态良性发展,让互联网发展成果惠及各国人民。本研究从虚拟主体的特征出发研究网络道德价值观建构
水凝胶由于其高吸水或吸收生物液体的能力,能够充分模拟细胞外基质的结构和功能,因此在药物释放、细胞培养、组织工程等方面具有潜在应用。然而,水凝胶的制备通常需经过复杂繁琐的过程来合成功能性单体,且水凝胶功能性单一,在释药时可能存在突释现象或缺少智能响应性,限制了其在生物领域的应用。针对这些问题,本文通过简单快速的方法制备了不同交联结构的水凝胶,通过调控交联网络实现了水凝胶对药物的可控及响应性释放,并研
海岸波浪破碎和其引起的波生流(沿岸流和裂流等近岸环流)是引起海岸泥沙输移、海岸变形和污染物扩散的主要动力因素,因此研究波浪破碎和波生流运动规律具有重要的理论意义和应用价值。本研究建立了缓坡海岸上的波浪多次破碎情况波能耗散的计算模型,给出了波浪多次破碎引起的沿岸流剖面的特征,并研究了沙坝海岸上的边界(丁坝)控制裂流系统的流动特征。研究主要采用模型实验方法,同时也采用了数值模拟和理论分析。缓坡海岸是一
季节性湖冰是地处中低纬度的泛第三极区域冰冻圈的重要组成部分,其变化是区域气候的重要指示器。与高纬度湖泊相比,该区域在冬季具有太阳辐射强、降水少、冰厚度小和表面泥沙含量高等特点。研究该区域湖冰对于分析气候变化对泛第三极区域冰冻圈影响、保障“一带一路”建设具有重要意义。本文选取中低纬度干旱、半干旱区域浅水湖泊的典型代表乌梁素海,于2015-2018年开展了连续3个结冰期的湖冰辐射特性和生消过程的现场调
纳米金属晶体的塑性变形以及微观断裂行为与晶体内缺陷的动态演化和运动息息相关。深入了解内部缺陷的演化规律和缺陷间的相互作用对纳米金属材料变形行为的影响,对于提升材料的强度、延展性、抗断裂与抗辐射性能和服役寿命具有重要的学术意义及应用价值。近年来,通过合理调控界面缺陷和体缺陷以提高纳米金属材料综合性能的增强策略备受关注。因此需要对界面缺陷调控的塑性变形机制以及位错-体缺陷间相互作用机制进行更加深入地考