基于深度学习的遥感图像目标检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Mickey123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,遥感高分辨率影像在民生和军事领域具有重要的价值,随着遥感图像数量的激增,传统的解译手段已不能满足日益增长的任务需求,智能化目标检测技术在该领域起到了关键作用。然而,将目标检测技术的应用于该领域存在诸多挑战,不同于普通的光学图像,遥感图像分辨率高、尺度变化剧烈,最重要的是具有特殊的鸟瞰视角,使用通用场景下的水平检测框会引入不必要的背景信息以至难以得到准确的位置信息,因此通常采用多边形或旋转检测框标注和检测,旋转的目标检测算法研究对于提升该领域的实用价值有重要意义。近几年,已有一些算法从目标表示、回归函数优化等方面提出了创新性的解决方法,而本文致力于改善整个网络的特征表示,旨在提升遥感图像目标检测的性能,获得更为精准的检测结果。针对所述问题,本文的主要研究工作分为以下三点:针对整个目标检测算法中旋转特征提取困难的问题,本文对Baseline的初始特征提取和检测头特征提取分别设计了改进策略。其一,通过分类激活映射图的可视化对比,选择了可解释性胜于CNN的Transformer网络,提取出了更准确的旋转目标初始特征,有效提升了尺度变化剧烈和大长宽比类别的目标精度。其二,针对普通骨干网络不能明确建模方向信息的问题,本文基于旋转等变的卷积核对特征图和FPN网络进行了重新编码,并在原Head后面,加入带有通道排列和插值两步变换的方向维度特征对齐模块,提升了检测精度,由于骨干特征尚不能完全贴合检测头的变换以提取准确的旋转不变特征,有待进一步改进。针对普通Transformer网络在不引入增强样本的情况下不能清晰建模目标方向变化的问题,在上述算法的基础上,本文引入了群等变自注意力的理论,参照旋转等变的CNN网络的搭建,设计了群等变自注意力的骨干网络来提取旋转等变的图像特征,该等变特征能够适应不同朝向的物体特征,与方向维度特征对齐的检测头配合可以得到更为精确的旋转不变特征,提升了遥感目标检测算法的平均精度。针对上述算法推理速度慢、网络结构复杂的问题,本文进行了相应的优化设计,重新定义了RPN网络中Proposal的表示方法,构建快速且高质量的二分类前景区域旋转特征提取网络,将三阶段网络结构压缩为两阶段。实验结果表明优化后的算法能够在损失不到1%精度的情况下有效提升8%到10%的推理速度,与“单阶段”算法几近持平。
其他文献
多智能体系统是对现实世界中各种互联群体的抽象描述,包括生物社群、机械军团,甚至产业集群等,其成员之间存在多元化相互作用方式,包括但不限于合作、竞争甚至对抗,通常由智能体间的符号网络表达。多智能体系统协同控制的本质目的便是利用或调解成员之间的关系,实现群体的共同目标,相比仅考虑合作关系的常规协同控制,符号网络下的协同控制面临独特的挑战和机遇,受到大量关注。论文针对符号网络下多智能体系统协同控制问题开
学位
目标识别与跟踪技术广泛应用于各个领域,传统固定监控设备的监视范围有限,无法长时间跟踪多目标,随着无人机技术的发展,无人机已然成为一种新型监控设备。对于无人机视角下的目标识别跟踪任务,除存在遮挡等传统难点外,还面临目标尺度小、计算资源匮乏等挑战,本文针对以上问题进行了研究,设计了一种适用于无人机平台的多目标行人识别跟踪算法。本论文的主要工作如下:(1)针对无人机视角下目标尺度小及计算资源匮乏的问题,
学位
二十大报告明确提出,未来五年是全面建设社会主义现代化国家开局起步的关键时期,也是经济高质量发展取得新突破的关键时期。在此发展背景下,国有企业有必要全面提升财务管理水平,构建战略型财务管控体系,以高质量财务管理支撑企业高质量发展。全面预算管理作为全面统筹各项经济业务,实现业财融合最有效的管理工具,国有企业有必要充分利用并发挥其管理价值,使其更好地为业务赋能,为决策支撑,进一步发挥财务价值创造作用,提
期刊
近年来,物联网终端用户和业务需求爆发增长,然而由于地面网络较大程度受限于地理环境,仅依靠地面网络难以实现“万物互联”的宏大愿景。卫星网络是对地面物联网系统的补充和延伸,能够有效解决地面网络在部署时面临的环境受限问题。同时,低轨(LEO,Low Earth Orbit)卫星网络具有全球覆盖和短时延等多种优势,因此未来物联网的发展趋势是从“万物互联”的愿景出发,构建低轨卫星物联网,提供高速、全覆盖和稳
学位
网络直播技术对空间的分界产生了重要的影响,虚拟与现实的边界不断被模糊,在直播的过程中依靠互联网实时交流技术实现了爱德华·索亚提出的第三空间概念,第一空间、第二空间与第三空间紧密串联,受众既身处观看直播的当下现实物理场景中,又身处主播与平台搭建的虚拟流动的第三空间中,同时在第二空间中受众的精神搭建与理想自我建构在不断进行着。在直播经济市场飞速发展的背景下,低俗、色情等乱象也悄悄攀枝而上,审丑直播对一
学位
作为无人机飞控系统的核心,控制律的质量好坏是保证飞机正常工作的关键,因此,对飞行控制律进行试验是确保其安全、稳定的重要手段。在以往的机载软件测试上,人们更多的关注点在于软件本身的测试,即对软件的功能和性能进行测试,而针对实际的飞行场景测试研究较少。因此,对飞行场景的测试用例的自动生成技术进行研究有重要现实意义。本文以航空软件的测试作为研究背景,以DO-178B机载系统和设备认证中的软件注意事项为标
学位
报纸
在大型工程中,由于工程量大而且需要大推动力,以电液伺服系统驱动大型负载是一个必然趋势。近年来,随着技术的进步以及工程任务要求的提高,单独的电液伺服执行器的局限性逐渐显露,即无法驱动复杂结构或质量大的机械,而多个电液伺服执行器协同控制,共同工作可以得到更好的结果,以此来满足工业需求。在实际应用场景中,多个电液伺服执行器往往是分布式驱动的,而在分布式系统中,每个节点的相互通信是存在一定时延的。随着工业
学位
本研究基于批判话语分析视角,从文献计量法的角度出发,将中国广告学术话语体系置于社会文化语境,考察中国广告学术话语体系的文本呈现、话语实践与社会实践。改革开放40年来,中国广告学从无到有,从一个研究领域成长为一门独立学科,经历了初探、搭建到整合与重构的历史演进。作为理论型与应用型并行的学科,广告学的学术研究、学科建设与社会发展、行业实践有着密切的联系。通过对中国广告学科话语体系的研究可以发现,每个发
学位
图像配准可以综合利用多传感器图像进行数据提取和信息分析,在现代信息处理领域具有极其重要的意义。在计算机视觉研究领域中,多模态图像配准的代表性类型是红外光和可见光图像配准。与同源图像相比,由于不同的成像机制,不同传感器获得的同一区域的遥感图像显示出不同的分辨率、像素值、光谱相位和场景特征,红外光和可见光图像的配准具有一定的难度和特殊性。因此,研究一种基于几何约束的图像配准方法,使之能够应用于红外光与
学位