基于元学习的判别性目标跟踪算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:qq1123388099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单目标跟踪是计算机视觉的关键领域之一,该任务要求在给定第一帧目标信息情况下,在后续视频帧中标注出目标状态。判别性目标跟踪算法因其对目标背景信息的充分利用提高了模型判别性而受到跟踪领域研究人员的青睐,但该类算法仍存在对网络不同特征层信息利用不充分、目标回归不精确以及模型泛化能力不足等问题。为解决以上问题本文做了如下的工作:(1)针对跟踪网络未能充分利用网络不同特征层信息问题,本文基于判别性目标跟踪算法,采用多分支融合结构提高模型鲁棒性以及相似目标辨别度以减轻跟踪过程中产生的目标漂移现象,此外对该分支采用元学习训练方式以增强模型泛化性能。其次,对于人工标注数据集中不准确标注给模型精度带来的不利影响,本文采用基于蒙特卡洛采样的KL散度训练回归分支,从概率角度解决回归问题以减轻上述影响。(2)针对跟踪网络目标特征提取不够充分问题,本文在跟踪网络中应用具有空间注意力机制的Transformer结构进行特征提取。此外,本文将能量模型应用到目标跟踪回归任务中,将概率回归问题转化为优化基于能量模型问题,针对其中归一化函数复杂积分难以估计的问题,应用扩展的噪声对比估计训练能量模型以更加精确预测目标位置。(3)针对目前基于Transformer目标跟踪算法模型复杂度较高问题,本文聚焦目标跟踪任务特点,探寻新颖的模板帧与搜索帧之间交互方式,采用基于可变形注意力机制的编码器模块与基于自注意力机制的编码器模块结合的方式进行特征交互。基于可变形注意力机制的编码器能够精准追寻到目标位置而不用聚焦全部像素点,降低了模型参数量的同时也有效提升模型精度。
其他文献
随着生产装备过程的日益复杂,单体的非线性系统模型已经不能满足现代工业生产的建模需求。互联非线性系统由于能够描述复杂的工业生产过程,已经引起了许多学者的关注。互联非线性系统由若干个相互连接的子非线性系统构成,具有耦合和不确定性等特点。在互联非线性系统中,时滞或执行器故障对子系统稳定性造成的影响会通过相互作用传递给其他子系统。因此,研究互联非线性系统在出现时滞和执行器故障情况下的控制策略具有重要意义。
学位
我国正处在大发展大变革大调整时期,国际形势错综复杂,国内改革任务任重而道远,国际人才竞争日趋白热化,世界各国都意识到人才在国际竞争中的重要性,人才是一个国家综合实力提升的重要保障。我国历来重视对于人才的培养,改革开放以来,我国经济社会对人才的渴求日益增长,1978年十一届三中全会之后,中央便将“尊重知识、尊重人才”确立为我国的国策;2007年将人才强国战略作为发展中国特色社会主义的三大基本战略之一
学位
随着科技的进步和智慧城市的发展,人们对公共安全的需求不断提高,海量视频监控系统已经广泛部署在机场、社区、街道、商场等公共场所,如何高效智能化地分析拍摄的海量视频及图像数据从而实现安防监控与刑事侦查,成为当下研究热点。作为智能视频监控系统中的一种前沿技术,行人重识别受到了学者们的青睐,其主要任务是匹配多摄像头下的同一目标行人。近年来,随着深度学习技术的不断发展,行人重识别领域出现了大量的研究成果。然
学位
伴随着城市道路的交通压力和人们对高科技生活的追求,智能驾驶系统一直是重要的研究内容,作为该领域的重要分支之一,交通标志检测技术的研究也同等重要。现如今的交通标志检测主要面临着检测对象目标小、检测场景复杂、实时性检测差等挑战。对于这些问题,本文选择以卷积神经网络为工具来进行研究。为提高特征的学习能力,本文以基础的检测网络为框架,并加强特征提取的深度,通过不同尺度特征融合和多级预测来提高特征的利用率。
学位
随着计算机技术的发展与人工智能应用领域的不断扩大,手势识别在人机交互中变得越来越重要。无线通信技术的发展以及Wi-Fi设备的广泛使用,使得基于Wi-Fi信号的手势识别成为研究的热点。本文针对传统的基于Wi-Fi信号的手势识别存在的特征不明显、提取高层次特征难度大等问题,提出基于信道状态信息(CSI)和轻量级深度网络的手势识别方法。主要研究内容如下:首先,针对传统基于机器学习的手势分类方法中人工设计
学位
近年来,锡基钙钛矿材料由于具有良好的光电性质,如接近S-Q极限的理想带隙、高载流子的迁移率和低激子的复合能,在无铅钙钛矿太阳能电池中备受关注。短短数年间,锡基钙钛矿太阳能电池(TPSCs)性能取得了日新月异的发展,目前官方最高认证的光电转换效率可达14.8%(认证14.03%),但与铅基钙钛矿太阳能电池相比,其效率和稳定性仍然偏低,主要原因锡基钙钛矿结晶不可控会产生较多孔洞,导致成膜质量不佳,此外
学位
本文针对线性Lamb波对微损伤、早期疲劳等损伤形式敏感性较低的问题,开展了非线性Lamb产生、传播机理分析,同时针对实验系统搭建、传感器网络优化、非线性信号信号分析处理方法等内容展开研究,实现了利用Duffing混沌振子检测微弱二次谐波信号,同时基于最大Lyapunov指数提出了新的损伤指标σ,并以此完成了对微损伤的损伤程度、位置信息判断工作。这为基于非线性Lamb波结构健康监测技术提供了新的思路
学位
随着信息与通信技术的高速发展,数据库在各个信息领域中有着越来越广泛的应用,而数据库的分发使用是最为常见的应用场景,保证其过程间的数据安全更是重中之重。因此,数据库数字指纹技术应运而生。为了在给定的数据库及特定的使用场景下选取性能更高的数据库数字指纹,同时完善数据库数字指纹理论体系,对数据库数字指纹综合评价进行研究具有强烈的现实意义。当前数据库数字指纹综合评价过程中,主要存在以下问题:缺乏统一全面的
学位
随着分布式电源(Distributed Generation,DG)接入容量的日益增长,配电网在运行安全与供电稳定等方面面临着巨大挑战。DG接入配电网后,系统由原本简单的单一供电网络向复杂的多电源供电网络转变,发生短路故障时电流方向难以确定,且DG以不同容量、数量、位置及类型等各种条件接入对配电网的影响各不相同,所以原有的适用于传统配电网的保护方案不能满足含DG接入的配电网保护要求。针对上述问题,
学位
近年来,小型飞机运输系统促进了通用航空的发展,拓宽了航空运输服务。在这样的背景下,国家空域系统发生了巨大变化。近十年来,无人机已快速发展为民用应用,导致中低空空域日益拥挤,所以空中车辆安全问题成为空地综合车辆网络面临的主要挑战。而传统的监控技术无法支持未来密集的空中交通管理(Air Traffic Management,ATM)。因此,采用一种先进的自动相关监视广播(Automatic Depen
学位