基于元学习的可见光-红外视觉目标跟踪研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:pickbaobei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多模态目标跟踪的提出是为了利用可见光和红外数据的互补优势来实现成对视频序列的目标定位任务。但是多模态的跟踪起源偏晚并且需要成对匹配的信息,而成对数据的获取受制于专业的成像设备和高昂的人工标注成本,现有数据集规模相比于可见光较小且数据多样性匮乏。此外,可见光-红外数据在不同的挑战下并非都同时发挥正面作用,如何充分利用两种模态的优点并同时抑制噪声成为急需解决的问题,受最近元学习研究的启发,本文基于元学习的核心思想在可见光红外中尝试仅使用少量数据以获取更快更准更鲁棒的目标跟踪模型。本文就如何将元学习应用在可见光-红外目标跟踪上展开相关研究,主要工作包含以下两个方面:第一是基于模型无关元学习的可见光-红外目标跟踪。现有目标跟踪方法普遍存在的两个核心问题:1)初始帧中采集的样本目标和背景高度相似,信息高度冗余。2)跟踪器要么花费大量时间用于初始阶段训练,或者使用不完全训练模型致使跟踪性能严重受损。元学习作为小样本学习的强有力方法,缓解了传统深度学习的从头开始学习对算力和时间的消耗问题,能够在第一帧中快速自适应得到鲁棒的模型。具体为,在元训练阶段,对数据集以任务的形式来划分以及对其使用模型无关元学习的训练方式来优化网络,得到一个通用的网络初始表示使目标模型能够专注于对未来帧有用的特征,仅需要一次迭代即可适应不同视频序列,在大幅缩短耗时的同时避免使用复杂的训练方法和架构设计以及原始跟踪器的超参数选择。第二是基于黑盒元学习的可见光-红外目标跟踪。如何利用海量的可见光数据促进可见光-红外跟踪网络模型的学习是一个具有挑战性的问题。因此设计了一种基于元学习的模态知识转移网络,该网络利用来自可见光模态分支的参数化先验知识来指导热模态分支学习。具体来说,本文设计了一种新的元学习模块,以可见光模态分支的卷积参数为输入,生成一组参数来辅助热模态分支的训练。利用元学习模块,热分支可以利用生成参数的梯度信息对原始参数进行优化。到目前为止,这是第一个采用元学习技术传递可见光跟踪器的知识来帮助可见光-红外跟踪器,而无需显式生成形态数据。
其他文献
随着硬件计算能力的提升,实例分割领域中的瓶颈问题不再是大量的模型计算,而是昂贵的数据集标注成本。为了缓解实例分割模型在落地应用过程中标注成本高昂的困境,本文以低成本和快速的弱标注方式实现一种弱监督实例分割算法。在标注方面上,本文利用了在实例分割任务中自带的边界框和成本低廉的目标点两种弱标注,使标注信息在低成本下尽可能还原目标。在研究方法上,为了在实例分割模型中排除检测分支对掩码分支的影响,本文首先
学位
太浦河是跨两省一市的长三角生态绿色一体化示范区的空间骨架。目前发布的示范区国土空间规划草案已提出区域协同发展的目标,但从流域尺度的空间规划落实到场地尺度的规划设计尚缺乏中间层次的规划支撑,导致实际问题与解决策略之间的错位。浙大-西浦-同济联合Studio模拟了长三角生态绿色一体化语境下跨行政主体协作的跨学科、多尺度流域规划设计,回溯各个尺度,归纳原型设计策略作为系统性的规划设计导则,探讨在流域尺度
期刊
作为一种新兴的机器学习范式,联邦学习允许参与者在不暴露私有数据的同时协作建模,打破了“数据孤岛”的困境。然而,经典的联邦学习算法存在诸如通信开销高、无法实现个性化的协同训练等问题,使其难以大规模部署。针对上述问题,基于知识蒸馏技术的联邦蒸馏学习应运而生。通过聚合客户端模型预测而非模型参数,联邦蒸馏学习优化了联邦学习的通信效率,实现了个性化的协同训练。然而,联邦蒸馏学习可能受到来自恶意的中心服务器或
学位
图表示学习旨在学习节点低维特征表示,以应用于诸如节点分类、链路预测以及社区发现等节点级分析任务中,吸引了越来越多研究学者的关注。然而,现实世界中的复杂图数据通常表现出一种明显的层级结构,这一特性有助于提高图分析的质量。图层次表示学习的核心思想是以分层的方式聚合节点特征信息,并用低维稠密的特征向量表示图数据,从而可以使其更好应用于图分类等图级分析任务。面对规模愈加庞大的图数据,图简化技术可以在保持基
学位
随着网络时代的高速发展,真实世界中产生大量具有复杂关系且隐含重要信息的网络数据。挖掘网络数据中丰富的信息,对于网络分析具有重大意义。网络表示学习是一种在保持网络基本性质的基础上,通过映射函数将网络节点以一种低维稠密的向量形式表示的网络分析方法,这种向量表示结果可以应用于节点分类、推荐等网络分析任务,具有重要的研究价值。近年来网络表示学习取得巨大成就,在学术及工业界获得极大关注。现有方法大多可以将网
学位
结直肠癌是常见的恶性肿瘤,严重威胁人们的生命健康,而结直肠中的息肉被看作是结直肠癌的前兆,通过结肠镜检查可以有效的诊断出息肉或结直肠癌,但是人工的方式有一定的漏诊率。计算机技术的快速发展,使得开发出计算机辅助诊断(Computer Aided Diagnosis,CAD)工具成为可能,快速准确的息肉分割方法对诊断结直肠癌有着重要的意义。由于息肉本身的形状、颜色、大小变化很大,息肉分割一直是一项具有
学位
由于遗传密码存在的简并性,编码区中不影响蛋白质序列的单核苷酸突变被称为同义突变。同义突变在各种复杂人类疾病中起着重要作用。识别同义突变有利于人们对相关疾病的诊断与治疗。然而,精确识别有害同义突变仍然是一项非常有挑战性的工作。近十年来,一些基于机器学习的同义突变功能预测工具被提出来了。这些工作极大的促进了人们对同义突变的认识。在同义突变功能效应预测模型的构建过程中面临不平衡数据集的问题,已有的方法大
学位
方面级情感分析(Aspect-based Sentiment Analysis,ABSA),是实现一个句子中给定方面词的情感极性分类,常见的为情感三分类(即积极、消极和中立)。其在外卖评价、社交舆情分析、网购推荐、金融行情等领域中的应用屡见不鲜。在信息爆炸的今天,ABSA无疑拥有更广泛的应用场景和更广大的需求人群,具有重要研究价值和意义,因而在近年来被广泛关注。相关研究工作通常只关注方面词和句子序
学位
大规模最优化问题在现实世界中普遍存在,如神经网络训练、投资组合优化、稀疏信号重构、旅行商、0-1背包、加工调度、装箱、图着色等。当这些最优化问题的优化目标个数超过一个时被称为大规模多目标优化问题。多个目标之间可能互相影响或冲突,但是需要同时求解到最优值。进化算法是以达尔文的进化论为基础,通过将解决方案进行编码,以物竞天择、适者生存为进化方向,通过针对性地设计不同的种群初始化方法,生成子代解方法,环
学位
伴随着城市化进程加快和交通智慧化管理的需求上升,智能交通在未来的市场空间巨大。车辆重识别作为智能交通的重要一环,在交通智能管理领域发挥着重要作用。基于单帧图像的车辆重识别和基于视频的车辆重识别是车辆重识别两个基础的任务分支。基于单帧图像的车辆重识别算法任务多是集中在小轿车、商务车等中小型车辆,对公交车、载货车等大型车辆的关注程度很低。相比较于视频,单帧图像能够提供的信息终究是有限的。此外,单帧图像
学位