基于卷积神经网络的遥感图像多尺度目标检测方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:propelling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感图像目标检测是遥感图像智能解译分析的一个重要研究领域。随着近些年来遥感技术和深度学习技术的快速发展,以及遥感图像目标检测技术在军民领域广泛的应用需求,如何利用卷积神经网络(Convolutional Neural Network,CNN)提高遥感图像目标检测性能并应用到现实场景中已成为该领域的研究热点。与基于模板匹配、基于统计判决等的传统方法相比,基于CNN的方法利用多层网络自主学习样本特征,并具有强大的表征能力,极大的提高了运行速度、检测精度和对数据的适应性。但由于遥感图像固有的特性,导致目标呈现出尺度差异大、方向分布随机、背景干扰大等等特点,使得基于CNN的目标检测仍面临着漏检、虚警较多、边框定位不准等问题,有待进一步研究突破。针对遥感图像多类多尺度目标的检测问题,本文在研究背景及相关理论分析的基础上展开了深入的研究,本文主要工作如下:面向遥感图像多尺度目标的检测,设计了一种基于特征增强和锚点自动生成模块的多类多尺度目标检测框架。该框架在特征提取网络中引入可操控的空洞卷积模块来动态的调整感受野大小,以提取不同尺度的目标特征信息。在特征融合网络部分设计了增强特征金字塔,构造短接支路将原始特征图信息与金字塔特征图融合,实现特征增强,旨在提高网络对多尺度信息的表征能力。在候选区域生成网络中利用锚点自动生成模块学习更加准确的锚点框信息,生成更高质量的稀疏的锚点框。与多个对比算法的实验结果对比证明,本章方法均能取得最高检测精度,证明所提方法对于多类多尺度目标的特征提取效果更好,能够更加准确的检测遥感图像多尺度目标。面向遥感图像旋转目标的检测,提出了基于多尺度注意力特征金字塔网络和滑动顶点回归机制的目标检测方法,首先构造特征提取网络,通过加深特征提取网络的层次得到更高层次的语义信息,增强网络对于目标多尺度特征的提取能力。在多个尺度的融合特征图上使用组合注意力模块提高有效特征信息的强度,解耦目标区域与背景区域,降低背景信息的干扰。在回归阶段引入滑动顶点回归机制,通过学习边框四个顶点对应的滑动比例和旋转因子,将水平框转换为旋转框,加强网络对于不同方向目标的边框位置学习能力。实验结果表明,所提算法能够更加准确的检测遥感图像中的多类多尺度的旋转目标。
其他文献
监控设备已成为羊场的基本设施,基于计算机视觉技术检测羊脸,进而识别不同羊只,成为智慧养殖领域智能识别的解决方案之一。本研究以现有动物检测识别模型体积较大,缺少轻量化模型研究工作为研究背景,以奶山羊和滩羊为研究对象。利用摄像头得到的实时视频流数据,展开视频羊脸识别工作。首先通过羊脸检测模型标记羊脸区域,然后通过羊脸识别模型实现个体分类识别,得到一个可行有效的实时视频监控下的羊脸识别方法。针对羊脸相似
学位
在多源信息融合过程中,错误信息或欺骗信息管理是一个重要问题。欺骗证据的存在可能对最后融合结果造成极大隐患,如何识别欺骗证据是反欺骗信息融合的关键。本文尝试使用合作博弈理论中Shapley值思想,基于证据距离对融合系统异常的“边际贡献”得出所有基本概率指派函数(Basic Probability Assignment,BPA)组合的协作收益值,进而对信息融合中是否存在欺骗证据进行有效判定。在此基础上
学位
从电影发展史看,叙事曾挽救了新生的电影,让电影成为伟大的第七艺术。电影可以叙事,并且主流电影大多讲述故事,这对于观众是不言而喻的常识,为什么却成为电影叙事学家必须论证并解决的基本问题?本文论述作为一门科学的电影叙事学如何从学理上阐明电影与叙事、电影与叙述者、演示和叙述之间错综复杂的关系,并论述从结构主义经典叙事学向后经典叙事学研究的转向。面对数字时代出现的各种新的叙事现象,采取类似“叙事学+”的研
期刊
人工智能的发展已经被提升到国家战略高度,第三次工业革命的浪潮已经袭来。人工智能想要更好地与人打交道实现人机交互,亦或是帮助人类在医疗、公共安全、远程教育等领域实现更高智能化,在人脸识别和表情检测方面的研究尤为重要。2021年作为新冠病毒全球大流行之后的人类发展的元年,人们的社交距离普遍增大,佩戴口罩成为一道靓丽风景线。多种人脸遮挡的现实场景给相关识别任务的研究和发展带来了机遇和挑战,现实意义非凡。
学位
受限于光纤激光器热效应、非线性效应、模式不稳定、光纤端面损伤等因素,单根光纤激光输出功率存在理论极限,对多束激光进行合成是提升激光亮度、功率的有效技术途径。本文以基于双色镜的光谱合成技术作为研究对象,开展系统的理论和实验研究,旨在通过提高单路输出功率、增加合成路数,实现高功率、高光束质量近单模激光输出。1、介绍了光谱合成技术的应用背景,总结了国内外利用双色镜开展实验研究的发展现状,指出了基于双色镜
学位
对于腿足动物来说,步态和运动的速度以及周边的地形环境是紧密联系在一起的,因为在某一范围内的速度选择合适的步态能够最大限度的减小机体的能耗,同时选择合适的步态能够通过相应的地形环境,这些对于动物来说是十分重要的,而这也同样适用于腿足式机器人。其次是对于四足机器人的多步态运动控制而言,如果能在统一的控制框架下实现多种步态运动控制的目的,这不仅能够简化控制程序,同时还增强了控制方法的统一性和适用性,因此
学位
近年来,深度卷积神经网络(Deep Convolutional Neural Networks,DCNNs)在图像分类、语义分割和目标检测等计算机视觉领域中取得了巨大的进步。然而为了提高模型的泛化精度和质量,深度卷积神经网络模型的规模不断加深加宽,这使得模型的训练过程需要大量的时间和计算资源。现有的分布式并行加速训练方法主要有数据并行(Data Parallelism,DP)和模型并行(Model
学位
单晶硅反射镜在高功率激光系统中有着广泛的应用。单晶硅表层特定原子结构(即功能序构层)直接影响单晶硅负载能力水平。目前存在功能序构层结构对负载能力影响机理不明确、精抛光过程中单晶硅表面负载能力变化较大等问题,导致其负载能力难以确定性提高。针对上述问题,本文从单晶硅功能序构层结构光学性质仿真、功能序构层引入及调控等方面进行了深入研究,提出了基于功能序构层调控的单晶硅反射镜高负载能力制造新工艺,对于实现
学位
老龄化现象已经成为一个不容忽视的存在,在我国社会的持续稳步发展中,需要对其高度重视并审慎对待。第七次全国人口普查数据显示,G市60岁及以上人口总数为2130598人,占总人口比例11.41%,而65岁及以上人口则占总人口比例7.82%。广州人口总量持续增长,但劳动人口比重下降,预计到2025年,G市常住人口将达到2150万人左右,未来五年将进入老龄化和少子化"双加速"的转折期。居家养老是当前乃至未
学位
海上目标探测和定位对于国防安全有着重要意义,沿海侦察站可对第一岛链内的目标高精度定位,但对于第一岛链外的目标需借助卫星无源定位系统进行定位。随着战争形态的转变,对无源定位系统的生存能力和快速响应能力的要求变高,侦察卫星小型化和网络化成为新的研究热点和趋势,由于小卫星的有效载荷受限且电功率较低,其只能搭载性能有限的数据采集和卫星链路通信设备,因此对星上数据采集和地面站处理提出了新的要求。本文在低采样
学位