基于Bandelet全卷积孪生网络的遥感视频目标跟踪

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shanshan0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感视频卫星可以实现对整体环境和具体目标连续的全方位实时监控,从而高效率高精度的收集对地观测信息,在大范围交通监控、国防安全监测、军事动态指导等场景有着重要的应用价值,因此在遥感视频卫星数据上实现目标跟踪就显得至关重要。但是由于遥感视频卫星的自身特点使得遥感视频目标跟踪面临着目标尺寸较小、背景极为复杂、遮挡情况严重、目标可识别性较差等难题,现有跟踪器难以应对如此复杂的情况,算法鲁棒性不佳。针对上述情况,本文在孪生网络框架的基础上,研究了无锚跟踪策略、条带波理论、注意力机制、卡尔曼滤波对遥感视频目标跟踪的性能增幅,从而更加高效准确的实现遥感视频目标跟踪,主要工作如下:首先,提出了一种基于Bandelet和孪生网络的无锚遥感视频目标跟踪算法,来解决遥感影像目标尺度变化大,以及目标尺寸较小时提取到的特征判别能力不足等问题。该方法的主要思想是将无锚跟踪器迁移到遥感影像上,更好的适应遥感视频中目标位置和尺度的变化。并且将条带波变换与孪生网络相结合,帮助跟踪网络自适应的对图像的内在几何结构进行追踪,对于尺寸较小的目标也能够更加准确高效的提取到目标特征。实验结果显示,本章方法能够有效提升遥感视频中不同尺度目标跟踪的性能。其次,提出了一种基于多重注意力机制的无锚遥感视频目标跟踪算法。针对遥感视频中目标与背景区分度不高的问题以及互相关操作特征融合不充分的问题,引入了一种基于多重注意力机制的特征提取网络,包括组合注意力机制和交叉注意力机制。组合注意力机制使得跟踪网络能够更加重视与目标相关的有效特征信息,在跟踪过程中更加精确地定位到目标,交叉注意力机制使得孪生网络的两个分支在计算特征期间就能够进行有效的信息融合和交互,这样互相关操作时就能够更加准确的找到搜索区域中与模板帧相似的区域。实验结果显示,多重注意力机制能够帮助网络提取到更加有效的目标特征用于跟踪,从而提升遥感视频目标跟踪的性能。最后,提出了一种基于卡尔曼滤波的无锚遥感视频目标跟踪算法。为了应对遥感视频目标跟踪中常见的遮挡问题,首先提出了一个检测目标被遮挡和目标出遮挡的判断标准,接着使用卡尔曼滤波计算目标在被遮挡前大致的运动状态,在检测到目标被遮挡时以同样的运动速度和方向来移动跟踪框,这样当遮挡结束目标再次出现时,仍然在搜索范围内,使得跟踪器可以重新定位到目标进行跟踪。实验结果显示,采用本章方法对遥感视频进行跟踪,能够大大提升遮挡场景下遥感视频目标跟踪的性能。
其他文献
目标检测作为计算机视觉最基本的问题之一,是其它复杂视觉任务的基础。近年来,深度学习技术和硬件资源的快速发展推动了目标检测技术的发展和检测精度的大幅提升。但在实际应用中,深度网络模型几十甚至上百层的网络结构,包含了大量的参数和浮点计算量,需要极大的存储空间和运行空间,往往难以部署在资源有限的设备上进行实时检测。为了将目标检测模型能从服务器迁移到移动端投入使用,需要将模型进行轻量化处理,本文进行了如下
学位
高光谱遥感技术发展至今,已经成为了农业、军事、工业生产等多个领域中不可或缺的一项重要技术。对高光谱图像中的像素进行分类是高光谱遥感数据在实际应用中最为广泛的需求。以深度学习为代表的高光谱图像分类方法被大量提出,基于充足的标注数据,这些方法在分类性能上取得了显著的成效。然而,目前高光谱图像处理面临的主要问题是难以获得大量精准标注的样本来充分训练深度网络,数据问题已经成为限制分类性能的瓶颈。同时,高光
学位
近年来,深度神经网络技术在计算机视觉、机器翻译、推荐系统等领域中取得了突破性的进展。然而,巨大的内存消耗和计算成本阻碍了神经网络在移动端智能设备上的大规模部署和应用。因此,模型压缩技术应运而生,其通过压缩网络模型的参数量和计算量来提高模型在资源受限环境中的推理效率。本文主要在卷积神经网络的量化感知训练、训练后量化以及稀疏感知训练领域,以训练代价更低、量化精度更高和泛化能力更强为目标开展研究,主要工
学位
得益于数据规模的不断扩大和人工智能算法的不断创新,医学图像的自动报告生成近年来引起了人们的兴趣。然而识别疾病及其预测其对应的大小、位置和其他医学描述模式,对于生成高质量的报告至关重要,这是一项挑战。尽管之前的方法侧重于生成可读的报告,但图像的视觉特征与语义特征之间仍存在着“语义鸿沟”问题。本文围绕目前主流的基于深度学习的生成医学图像报告的方法展开研究,使用内窥镜医学图像数据,提出了适用于多模态的医
学位
目标检测是计算机视觉领域的热点和核心问题之一,其目的是在一幅图像中寻找特定的目标,然后对目标进行精确的定位和分类。它是分析和解译视觉信号的重要基础,已被广泛应用于工业质检、视频监控和无人驾驶等众多领域。近年来,目标检测的研究取得了一系列进展,然而图像目标检测算法仍然面临着许多挑战。本文从提升目标检测性能的三个不同角度出发,使得定位更加准确,分类更加精确,模型更加轻量。首先,本文从目标检测中的定位角
学位
人体姿态估计任务是计算机视觉领域的一个研究热点,首先需要检测出图像中人体不同部位的关键点,然后再估计出人体姿态。随着对深度学习特别是对深度卷积神经网络研究的深入,基于深度卷积神经网络的二维人体姿态估计取得了极大进展,目前基于深度卷积神经网络的姿态估计方法已经成为人体姿态估计的主流方法。尽管人体姿态估计方法取得了较高的精度,但是仍存在一些优化改进空间。首先,大多数现有的基于深度卷积神经网络的二维人体
学位
目的:分析我院神经内科脑梗死患者的用药合理性,对患者进行药学监护,保障患者用药安全、合理、有效。方法:以2017年3月至9月期间神经内科脑梗死患者为对照组,2018年3月至9月期间神经内科脑梗死患者为监护组。采用干预前后对照的研究方法对用药合理性分析,通过查阅病历,对照组采用回顾性分析方法,点评医嘱并总结医嘱不合理存在的原因;针对对照组存在的问题,对监护组进行医嘱干预。将两组的不合理医嘱按照数量、
学位
CTR(click-through rat,点击率)预测在广告推送,个性化推荐,电子商务,信息推送中发挥着重要的作用,而CTR预测依赖对高阶组合特征的建模,然而在最近的研究中却存在着以下问题:(1)分配给所有的高阶组合特征相同的权重,限制了模型的表达能力。(2)传统的特征交互方式(比如内积,外积,哈达玛积)限制了高阶组合特征的表达。(3)使用深度神经网络对特征进行隐式交互,缺乏可解释性。本文基于多
学位
孔雀石绿是一种有毒的三苯甲烷类染料,具有较强的抗寄生虫、抗真菌、防霉的作用,故曾广泛用于水产养殖业。由于其具有高毒性及高残留性,目前已被世界各国列为水产养殖禁用药物。然而,由于其防霉效果显著、价格低廉、用量少、易得到,致使“孔雀石绿”食品安全事件屡禁不止。因此,寻找一种能够识别孔雀石绿的新型分子检测探针,实现水产品中孔雀石绿快速、定量检测具有重大意义。核酸适配体是一类新的、具有高度特异性和亲和力的
学位
行人重识别作为计算机视觉领域的重要问题,近年来受到学术界越来越广泛的关注。行人重识别任务旨在跨相机地查询行人图像,在现实生活中,对于治安维护、警方执法等具有重要意义。行人重识别的研究场景主要有三个:(1)有监督的行人重识别。面向的场景中,所有训练样本都是有精确人工标注的。(2)无监督行人重识别。面向的场景中,所有样本都是无标注的。(3)无监督域适应问题。在该场景下,存在一个有标签的源域和一个无标签
学位