基于深度学习的遥感图像旋转目标检测

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cheng2008YING
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感图像目标检测是遥感图像领域的一个重要研究方向,广泛应用于军事侦察和民用监控领域,其关键研究问题是如何提高遥感图像分类和定位的精度。然而,相对于自然图像,遥感图像目标存在排列密集、方向角度多、小目标数量大等特殊问题,利用通用的目标检测模型效果并不理想。因此,研究有效的面向遥感图像的目标检测方法,提升目标检测器的精度,具有重要的实际意义。针对遥感图像目标检测的上述问题,结合检测框设计和深度学习技术,提出了一种遥感图像目标检测模型,主要内容包括:(1)针对排列密集的问题,采用了DETR(Detection Transformer)模型作为整体框架。其通过编码器解码器结构和二分匹配来进行唯一的预测,与其他基于锚框的旋转目标检测模型相比,消除了锚框的设计和后置处理的必要,简化了整体计算流程。(2)针对方向角度多的问题,采用了基于环形平滑标签的旋转框长边表示法。旋转框能够使包围更加紧凑,定位结果更加精准,同时环形平滑标签的计算把回归问题转化为分类问题,解决了角度周期性对训练的影响。(3)针对小目标数量大的问题,提出了一种基于Dark Net和特征金字塔网络的融合策略。为了提高小目标的检测性能,利用Dark Net网络在金字塔底部引入了一层专用于小目标检测的高分辨特征层,并利用一个下采样层和两个上采样层结合的多尺度融合策略来生成具有丰富信息的特征图。(4)针对遥感图像分辨率高的问题,提出了一种基于可变形注意力机制的解码器。Transformer结构使得训练时间变长,该机制替换原始注意力机制后,使得计算注意力权重时只需要基于部分采样,加速了模型收敛,同时也降低了计算复杂度与所需的空间资源。实验结果表明,所提出的模型对比先前的旋转框检测模型有着更高的精度。具体地,该模型在提取的数据集上平均精度达到了74.87%,说明该模型能很好地适应遥感图像中各类目标的形状与分布特性,具有一定实用性。
其他文献
点云补全旨在将残缺的稀疏点云还原成完整的密集点云。基于孪生网络的方法通过特征匹配学习完整点云的先验信息,但是其使用的基于多层感知机的编码器提取点云特征时性能不佳。而基于变换网络的方法虽然采用点变换与点集抽象等手段解决该问题,但它没有利用完整点云结构的先验知识。此外,现有点云补全方法忽视了保持全局结构的重要性,这导致部分样本在细化时会逐渐偏离原有的形状。为了更好地利用完整点云中的先验信息,同时避免补
学位
乡村要振兴,教育需先行。乡村振兴战略是新时代党中央为破解乡村发展困境、全面提升乡村治理体系和治理能力现代化的重要举措。农村教育在乡村振兴战略的推进中迎来新发展机遇的同时,也面临着教育价值取向功利化、农村义务教育学校布局困境、人才培养目标定位矛盾、城乡二元结构对立等问题,出现了农村教育的“内卷化”现象。树立城乡教育一体化优质均衡发展理念、构建内外协同的农村教育制度体系、形成多元参与的保障共同体、培育
期刊
“认识秒”是一个托底课程,在此之前,学生已经学习了“时”和“分”两个常见的时间单位,不仅如此,学生还能认读和书写一般精确到分的时间时刻。“秒”是继“时”和“分”后出现的一个较小的时间单位,由于在日常计时中存在感很低,而且时间单位较为抽象,缺少直观的事物来刻画和形容,不像长度单位、面积单位那样可以借助许多事物来直观演示,且1秒的时间过于短暂,小学生很难敏锐地感受其长短。因此,本课着力解决这一难点,通
期刊
密码管理机制是一种利用数据库批量存储和管理个人密码的技术手段。为保证安全,用户的密码数据须进行加密处理后存入数据库。然而在实践中,用户往往倾向于使用简单重复的低熵密码作为密钥,这使得传统的密码管理机制极易受到合法编码问题的影响。同时,撞库攻击的存在也极大地威胁了密码数据库的安全,此种攻击利用数据库内泄露的信息作为参照,使得攻击的成功概率极高,极易造成大规模的隐私泄露。针对上述问题,提出了一种基于蜜
学位
近年来,随着互联网的发展,人们对基于位置服务的精度要求越来越高,由于WiFi设备的低成本和广泛部署,基于WiFi指纹的室内定位技术成为研究热点。但是大多基于WiFi指纹的室内定位技术存在两个问题:一是定位精度易受接收信号指示强度(Received Signal Strength Indication,RSSI)波动的影响,导致定位精度不高;二是设备多样性使得在线定位阶段的RSSI数据和离线训练阶段
学位
冠状动脉各解剖节段的准确识别对于心血管类疾病的诊断是非常重要的。目前的计算机辅助诊断系统通常不考虑报告冠状动脉疾病的病理位置,这就需要放射科医生手动进行相关检查和报告病变区域。实现冠状动脉的自动分段标记,将提高医生疾病诊断的效率,也有利于计算机辅助诊断技术的进一步发展。冠状动脉分段标记主要存在的问题是个体间的差异性大。很多现有的冠状动脉的自动分段方法存在识别的分支数量较少、侧支准确率较低、网络结构
学位
随着互联网的发展,数据发挥着越来越重要的作用。分布式协作机器学习允许多个客户端设备参与训练,同时一定程度上保证了数据隐私,因此迅速兴起。联邦学习和拆分学习是其两种主流实现方式。拆分学习与联邦学习相比可以更好地缓解客户端计算资源匮乏的情况,且具有更好的隐私性。用户参与拆分学习的目的是要通过参与全局的训练提高预测精度,然而参与训练的客户端设备数据的非独立同分布问题可能会对训练模型产生负面影响,导致客户
学位
电子计算机断层扫描是无创评估肌肉质量的黄金标准,依据第一腰椎位置的扫描图像中骨骼肌的面积可以鉴别是否患有肌少症。相对于人工手动标注的方法,自动分割技术可以提高分割效率以及准确度,再借助临床数据即可实现计算机辅助诊断。但现有的分割模型在来源不同或质量不一的图像上泛化性不够好,或者在分割区域边缘时不够精确,存在准确率不够高的问题。针对现有模型在肌少症辅助诊断领域准确率不够高和泛化性不够好的问题,提出基
学位
课程标准是有效实施教学的前提,也是指导教师如何把握课堂教学的依据,其中教材是实现课标要求的载体。进行教学设计首要任务就是研读教材,而研读的关键在于重难点的把握。《秒的认识》一课的重点难点确定为建立"1秒"、"1分"的时间观念,如何建立?本文从三个不同的体验中去"启蒙"、"发展"、"强化"时间观念,从而突破教学的重点难点。
会议
随着计算机软件在当今信息社会中的普及,软件的安全和版权保护问题愈来愈受到人们的重视。二进制代码是应用软件的重要发布形式之一,因而二进制代码和源代码匹配在应对这两个问题中发挥着重要作用,例如使用源代码来搜索已发布软件中的漏洞、对二进制代码进行溯源以检查其是否违背开源协议。目前,一些方法已经被提出来用于解决二进制代码和源代码匹配问题,这些方法通常是通过某些相似性约束来共同学习二者的嵌入(Embeddi
学位