基于anchor-free与轻量化的遥感图像目标检测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:songshuguiyu00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感图像目标检测作为一个基础且具有挑战性的视觉任务,不仅在军事领域应用广泛,如准确获取战场信息并对敌方进行精准打击。它还在民用领域具有广泛的应用,例如环境管理、区域规划和矿产资源勘探等。现有的遥感图像目标检测方法大都基于anchor boxes,这类方法会因为过多的anchor boxes引入大量的超参数,增加了内存占用以及冗余的计算量,甚至会导致严重的正负样本不平衡等问题。另外,遥感图像又具有背景复杂,目标尺寸变化大且排列密集,目标具有方向性等特点,进一步增加了遥感图像目标检测的难度。除此以外,现在的遥感图像尺寸越来越大,数据量也逐渐增多,为了能够获得更好的检测性能,模型的深度和复杂度也随之增加,虽然这很大程度提高了检测精度,但是在对模型复杂度有很高要求的应用场景下,例如军事领域需要将模型部署到无人机等设备上进行监测任务,如果模型过于复杂也是不易部署的。构建稳定轻量且性能好的anchor-free遥感图像目标检测器,是该课题研究中的重点。本文具体研究工作如下:(1)针对现有遵循anchor机制的遥感图像目标检测所带来的问题,本文提出了基于anchor-free的遥感图像目标检测方法。在该方法中本文设计了密集路径聚合特征金字塔网络,该网络充分利用高层语义信息与低层纹理信息,提升了网络对于不同尺度目标的检测能力。除此以外,本文还提出了中心区域采样策略,避免了采样过程中模糊样本或者噪声样本对模型性能的影响。实验表明本章方法在遥感图像目标检测任务上能够获得更好的表现。(2)针对遥感图像中目标具有任意方向的特性,本文提出了基于关键点的遥感图像定向目标检测方法。在该方法中,考虑到遥感图像背景复杂导致特征中会有很多的噪声信息,导致特征比较粗糙,本文提出了语义迁移模块对特征精细化。另外,考虑到遥感图像中的目标尺寸变化多样,提出了自适应高斯热图对目标进行定位和分类。实验表明本章方法在遥感图像定向目标检测任务上能够获得更好的表现。(3)针对遥感图像目标检测模型被过度参数化的问题,本文提出了基于知识蒸馏的遥感图像目标检测方法。通过该方法得到了一个轻量的检测网络。实验表明,该方法在精度损失较小的情况下,可以大幅度降低模型复杂度。
其他文献
21世纪以来,物联网以及大数据,云计算不断发展为嵌入式存储器尤其是SRAM的变革带来动力。移动终端的高稳定性,低功耗的需求促使着人们对更低工作电压环境下SRAM技术的研究。但低电压下最小尺寸的SRAM存储单元的读写能力迅速下降,先进工艺下的工艺波动带来的影响越来越大,常用的传统6管(Transistor,T)存储单元结构越来越不适应先进工艺下的稳定性需求。因此,论文从常用的6管存储单元结构出发,基
天地一体化网络(Space-Terrestrial Integrated Networks,STIN)是未来军民用通信网络的重要发展方向,统一的管理控制和规划是STIN的建设目标,这要求STIN具备灵活可重构的架构和极高的可靠性。由于STIN的自身特性,STIN中的可靠通信面临特殊的挑战。一方面,STIN规模庞大、结构复杂,且网络拓扑由于卫星运动而时刻发生变化,但传统网络管理运维方式静态且固化,效
在科学技术研究中,科技发展战略是一个至关重要的问题,其难点在于如何对未来科技趋势做出准确判断。现有的科技趋势判断主要由专家经验得出,主观性较强而且不够全面;此外,判断结果主要以科技咨询报告的形式呈现,且报告需要多名专家参与撰写,耗时耗力。针对科技趋势判断中的上述问题,论文对自然语言处理领域的科技文本自动生成技术开展研究,从而为专家撰写科技咨询报告提供前置支撑。本文研究内容主要有三个部分,一是构建价
伴随着通信产业和计算机视觉技术的飞速发展,无人驾驶已经成为了科学技术和实体经济相融合的典型代表,在构建汽车产业生态和促进经济发展上都扮演着举足轻重的角色。但是,受限于现有的传感器硬件水平和感知技术,无人驾驶系统的安全性还有待提高。因此,利用激光雷达点云进行精确的三维感知,对实现高级别的无人驾驶系统具有十分重要的研究价值。本文针对现有点云目标检测算法的不足之处,分别从减少信息损失和克服点云稀疏与分布
肺炎对于儿童和老人而言,是一种患病率和致死率很高的疾病。随着现代医学技术的不断提升,人们在肺炎的治疗方面取得了显著成效。肺炎的诊断是治疗前非常重要的环节,但是由于肺部其他疾病干扰、医疗数据的爆发式增长以及相关病理医生的缺乏,导致肺炎的诊断较为困难,如何做到肺炎病症“早发现,早治疗”,对于肺炎患者的治疗效果具有重要意义。随着现代医学的发展,肺部疾病的诊断更多地依赖于对医学影像的判定。而越来越庞大的数
随着5G、大数据、人工智能、物联网等高新技术产业的快速发展,存储器的集成度和性能也与日俱增,然而传统的半导体存储器在几十年的发展后已逐渐接近其物理瓶颈,高新技术产业需要速度更快性能更好的新型非易失性存储器。目前已有多种新型存储器进入研究者的视野,在这些存储器中阻变存储器凭借其结构简单、成本低、集成度高以及和传统CMOS工艺兼容性好等优点引起了业界的高度重视。而在多种阻变材料中,氮化硅材料基于其优良
阵列雷达波形设计和接收波束形成是实现目标有效探测的关键技术。MIMO雷达由于其发射分集技术,与传统相控阵雷达相比,具有系统自由度高、抗截获能力强以及多普勒分辨率好等特性,但也具有正交波形难以实现等诸多局限性。近年来将时间步进量引入传统的阵列构型之中的新型发射分集MIMO雷达受到研究人员的广泛关注。本文针对时间分集阵子阵划分技术展开进一步研究,提出了基于不同布阵的子阵划分方法以及基于扩展Barker
安全芯片作为信息系统的组成部分之一,广泛应用于金融、军事、银行等领域,与我们的生活息息相关,确保数据在传输过程中的安全至关重要。而且随着计算机技术的快速发展,中央处理器CPU与主存储器之间的速度“存储墙”问题愈加严重,严重影响了微处理器的性能,高速缓存Cache技术是为了解决这一速度匹配失衡问题而采用的一项关键技术。在安全SOC芯片中,CPU对主存的访问一方面需要Cache确保高效率数据读取,另一
近年来,随着人工智能的飞速发展,其广泛应用于工业等各个领域,但是由于人工智能的很多技术尚未成熟,在很多方面仍然有许多改进的空间。卷积神经网络作为人工智能的核心部分,其起源于20世纪60年代,当时科学家们正在研究猫的大脑皮层,在研究过程中发现卷积权重的共享和连接节点的减少,能够大大减少了神经反馈网络的复杂性。然而,由于硬件的局限性和有效的优化算法的缺乏,这项技术并没有得到较好的开发。随着神经网络的广
车牌识别已广泛应用于自动收费、违法抓拍、监测报警等场景中,但其算法实现千差万别,且其性能也严重依赖学习及测试数据集。受采集时间、天气、图像传感器安装位置,遮挡,污损等因素影响及限制,所采集的真实场景图像数据在数量上非常有限,质量上极不均衡,成像空间也很不完备,再加上用户个人隐私等原因,无法形成统一公开完备学习及测试数据集,从而导致车牌识别算法性能评测缺乏说服力,难以防御对抗样本的攻击,继而严重阻碍