基于深度学习的遥感影像近岸舰船目标检测和细粒度识别方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wxiaof
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用光学遥感影像有效地检测近岸舰船目标并进行细粒度识别,在军事和民用领域都有着广泛的应用前景。在近岸背景下的舰船目标检测方面,由于陆地背景干扰、海杂波干扰、舰船停靠朝向任意、排列紧密等因素的影响,增大了舰船目标检测的难度;在舰船目标细粒度识别方面,舰船类间差异小,同时标注数据集稀少,增加了舰船细粒度识别的挑战性。基于深度学习的目标检测与识别方法在计算机视觉领域表现优异,但关于基于深度学习的近岸舰船目标检测与细粒度识别的研究还较少。论文以遥感影像中近岸舰船目标为研究对象,在精确检测、细粒度识别、检测与细粒度识别一体化方面做了一系列工作,获得了一些有理论意义和参考价值的成果。论文的主要工作如下:针对近岸舰船目标检测中漏检率高的问题,提出了基于实例分割和特征解耦的舰船目标检测算法。通过设计自适应特征金字塔模块和边界解耦模块,增强了语义分割网络的判别能力;利用双分支预测模块,可以更精确预测舰船与舰船中心点;通过精确预测的舰船中心点对舰船目标进行实例分离,提高了检测召回率。实验结果表明,所提算法实现了像素级的检测精度,有效提高了近岸舰船目标的检测率。针对舰船目标外观相似、特征差异小难以有效区分的问题,提出了基于注意力机制与多级视觉特征融合的舰船细粒度识别算法。设计局部注意力模块获取判别性强的局部细节特征;构建多级视觉提取与融合模块,将局部注意力扩展到多级特征表达上,增强了特征的类别判别能力;利用梯度增强损失函数,专注于易混淆负类,进一步提升网络的识别性能。在自建舰船细粒度识别数据集上进行了仿真验证,算法准确率达94.9%,与其他算法相比,该算法具有更高的细粒度识别准确率。为提升近岸舰船目标检测与细粒度识别任务的工程实用性,提出了一种基于旋转框的近岸舰船目标检测与细粒度识别一体化算法框架。设计了上下文注意力增强模块,提高了网络对目标的关注度;采用旋转等变网络、局部长旋转不变性池化模块,实现对舰船目标的精确定位和局部细粒度特征的抽取;通过注意力机制指导,实现了全局和局部区域特征的有效融合;通过设计解耦模块,克服了检测与识别共享特征冲突的问题。实验结果表明,该算法有效提高了近岸舰船目标检测与识别的准确率。
其他文献
与两电平逆变器相比较,三电平逆变器以其输出电压波形正弦度更高、谐波特性更好等优点而得到了广泛的研究和应用。本文选取T型三电平逆变器作为研究对象,对其调制策略、共模电压抑制和中点电压平衡控制等进行了深入研究。为了降低三电平调制策略的分析复杂度,本文以小矢量顶点为中心,将三电平矢量图转换为结构简单的两电平矢量图,并根据两电平矢量的分布特点建立60°坐标系对T型三电平逆变器的空间矢量脉宽调制(SVPWM
学位
近些年,在人工智能、计算机视觉等技术的迅速发展下,包含无人车在内的移动机器人得到了充分的技术支撑。在移动机器人上部署实时定位与建图系统越来越重要,这是高智能化程度的移动机器人完成人机交互、决策规划和运动控制等任务的基础。然而,在缺少GPS、北斗等全局位置信号或信号较弱的情况下,基于单一传感器的SLAM算法受到场景纹理信息、光照条件、运动控制和传感器视角的约束,即便融合惯性传感器(Inertial
学位
显示技术正朝着高清化、柔性化的方向快速发展,并引起虚拟现实等领域的广泛关注。量子点发光二极管(QLED)被认为是最有前途的下一代显示技术之一,但要实现商业应用仍存在诸多挑战,如载流子注入不平衡、器件稳定性差等问题。本文针对QLED器件中ITO-有机空穴注入层的界面电荷注入问题,通过在界面引入致密稳定的无机NiOx薄膜,设计制备了无机-有机双空穴注入层(HILs)结构,改善器件功能层能级匹配,提高载
学位
膀胱活动不足(Underactive Bladder,UAB)是排尿期间出现膀胱无法有效收缩导致排尿时间延长,排空不完全等症状,并引发如急性尿潴留等严重并发症甚至死亡的泌尿系统疑难病症。UAB的直接原因是包覆膀胱的逼尿肌层收缩无力,其成因复杂多样,在老年人群体中发病率很高。临床上现行的药物或姑息治疗仅能延缓病情,如导尿管术等,而骶骨神经刺激疗法只针对特定群体。通过植入设备直接增加膀胱排尿期的收缩力
学位
汽车保有量逐年增长,为生活带来方便的同时,也产生了更多的排放污染物,因此推行了严格的尾气排放标准。氮氧传感器作为汽车尾气处理系统中重要的组成部分,能够实时、精确地检测汽车尾气中的氧浓度,以此来实现对空燃比和氮氧化物浓度的测量,在汽车尾气处理系统中被广泛使用。由于氮氧传感器中的泵单元结构和特性复杂,实车运行中在尾气气氛变化剧烈的情况下泵单元必须快速响应以保证气氛检测精度,因此,对泵单元系统控制策略的
学位
随着当前移动通信技术和互联网大数据技术的发展,在线广告逐渐代替传统媒体广告,实时竞价广告(Real-Time Bidding,RTB)因此应运而生,并被不断发展和完善。通常情况下广告主为了获得广告展示机会,需要在需求方平台(Demand-Side Platform,DSP)开展的竞价评估中获胜。在竞价评估中,双方可能由于信息不对等而造成点击率预估的信息差。因此,研究更精准的点击率预测模型和不对称信
学位
固体氧化物燃料电池(Solid Oxide Fuel Cell,SOFC)技术以其清洁高效的优势成为新能源发电领域的热点,是驱动稳步建立安全、低碳、可持续能源体系的重要一环。然而,耐久性限制了SOFC大规模的市场化推广。作为一个热电气强耦合的复杂非线性系统,负载频繁波动、材料老化、环境变化等多方面因素导致系统在运行时出现故障与性能退化现象,大大缩短了SOFC的有效寿命。因此,本文以实现SOFC高效
学位
行人重识别是指从多个视野不重叠的相机所拍摄的图像中检索目标行人的技术,属于图像检索的子任务。实际场景中,由于光照和视角变化、遮挡、相机分辨率低等因素的影响,同一行人在不同相机下可能呈现较大差异。因此如何在巨大外观差异下,准确度量行人图像间的相似度是目前行人重识别算法需要解决的关键问题之一。本文将从深度度量学习的角度出发,利用深度神经网络提取行人特征,并使用度量损失函数监督网络训练,提升行人图像相似
学位
体系架构评价和选择是体系架构设计的核心,是武器装备体系论证的重要组成,是实现体系联合作战能力的起点。然而,体系的交互复杂性和不确定性给体系架构的评价和选择带来了较大的挑战。因此,亟需提出能捕捉体系特征的评价方法,以筛选较优的体系架构,为装备体系正向建设提供有力的支持。本文采用基于模型的系统工程思想,以美国国防部体系架构框架为标准构建体系架构模型。为了实现多维度的架构评价,提出能力-风险-成本多属性
学位
弱监督时序行为检测是视频学习中一项基础且具有挑战性的任务,其目标是在给定视频级行为标签的条件下,对未剪辑的视频中的行为实例进行分类和定位。现有的方法大部分致力于挖掘视频时间片段之间的相似性,但没有明确地对所有时间段之间的关系进行建模,从而忽略了一些对行为定位和分类有利的信息。本研究通过图卷积建模时间段之间的关系,使得行为检测网络同时考虑了视频片段特征以及视频片段之间的联系。此外,考虑到视频中不同片
学位