基于无锚框机制的SAR图像舰船目标检测方法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:nankaizhizhuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
舰船检测在海洋环境监测与港口安全保障中起着至关重要的作用,而基于传统光学图像的方法易受光照与天气条件影响。合成孔径雷达(Synthetic Aperture Radar,SAR)图像凭借其全天时、全天候的优势,成为舰船检测的重要数据源。随着机器学习等相关领域的发展,SAR图像舰船检测方法的性能不断提高。然而,近岸区域作为各个领域的重点关注区域,其舰船检测仍存在诸多亟需解决的问题。一方面,由于近岸区域场景复杂,背景噪声严重,检测器难以从舰船特征中准确分离出背景信息,造成误检率上升;另一方面,受近岸区域舰船密集,尺寸多变等因素影响,检测器难以有效提取舰船特征,导致漏检率上升。针对此,本文研究SAR图像近岸区域舰船目标检测方法。针对复杂场景舰船难检测问题,本文提出了一种基于场景解译的SAR图像舰船目标检测方法。首先,该方法通过场景解译模块对感兴趣区域进行全卷积逐像素预测类别,实现近岸海陆区域语义分割。其次,利用目标检测模块判断不同解译场景候选区域中有无目标并对其中目标进行分类以及边界框回归,完成不同场景区域中的舰船目标检测。最后,设计目标综合模块综合不同场景区域中的检测结果得到最终的检测结果。该方法将场景解译用于舰船目标检测可以分离背景信息对舰船目标的干扰,从而获得有效的目标特征,进而降低误检率,提高近岸区域目标检测的性能。针对多尺度、密集舰船难检测问题,本文提出了一种基于无锚框机制的SAR图像舰船目标检测方法。首先,该方法构建融入跳跃连接和聚合节点结构的无锚检测框架,通过融合多个分辨率下的特征实现多尺度的舰船目标检测。其次,设计关键点估计模块通过改进关键点估计策略缓解密集舰船目标的漏检问题。最后,设计通道注意力模块通过闸门机制增强网络对舰船目标的注意力以抑制背景噪声的干扰。该方法不受人工设计锚框的限制,可以有效融合多尺度特征和消除相邻舰船目标的相互抑制,从而解决多尺度、密集舰船目标检测的漏检难题,提高近岸区域船舰目标检测效率。综上所述,本文深入分析了SAR图像近岸区域舰船目标检测面临的挑战,研究了基于场景解译和基于无锚框机制的目标检测方法,分别针对复杂背景、多尺度和密集的舰船目标检测提出了有效的解决方案并设计了完整的检测方法。在公开的SAR图像舰船目标检测数据集上的实验结果表明,与一些当前最先进的检测方法相比,本文提出的方法实现了更高的检测精度和更低的误检率与漏检率。
其他文献
无线感知是一种通过分析受目标状态影响的无线信号来获取感兴趣目标状态信息的新兴非接触感知技术。该技术利用周围广泛存在的无线信号来对目标状态进行感知,其具有低成本、不受光照影响、隐私性较好等优点,因而使得其在智能家居、智能监护、人机交互领域有着广泛的应用前景。受深度网络在计算机视觉领域广泛应用并取得丰富成果的启发,无线感知技术近年来很多工作都倾向于采集无线数据集,然后基于数据构建无线射频图像数据集,接
学位
遥感图像目标识别是一种图像级的任务,目的是分辨遥感图像中物体的类别,在军事安全、海上交通等方面应用广泛。近年来,深度卷积网络在遥感图像识别任务中表现优异,相对于传统方法展现出巨大优势。目前,深度学习在遥感图像目标识别领域主要的研究方式为利用注意力机制获取辨识性特征或是加入检测、分割等子网络定位识别重点区域。然而,多数遥感图像目标识别研究仅适用于高分辨率遥感图像。针对低分辨率遥感图像目标识别准确度较
学位
随着资源需求的日益增加,世界各国愈发重视海洋资源的勘探与利用。水下无线传感器网络(Underwater Wireless Sensor Network,UWSN)作为开发利用海洋的重要技术手段之一,受到了学界和业界的广泛关注。但是,目前对水下无线传感器网络的研究仍面临诸多挑战,例如,水下传感器网络多功能节点的设计、网络节点的部署算法等。本论文围绕水下无线传感器网络的移动节点部署方法和水下多媒体信息
学位
显著性目标检测作为计算机视觉领域中的一项重要任务,对于图像高层语义的理解具备重要意义,为各类图像处理和计算机视觉相关任务提供了必要的先验知识。作为像素级图像分割任务,显著性目标检测非常依赖高质量、大规模的像素级标签作为数据支撑,其获取往往费时费力、代价高昂。因此,基于标注高效的图像级标签的弱监督学习近年来受到了广泛关注。现有工作大多关注于如何获取高质量的伪标签,而忽略了伪标签中广泛存在的噪声对于显
学位
虹膜识别使用人眼图像中虹膜区域丰富的纹理信息进行用户身份识别,是目前最安全、使用最广泛的生物识别技术之一。为了提升虹膜识别技术的性能,本文设计了基于深度学习模型的虹膜定位和识别方法,分别从虹膜定位、虹膜识别以及模型轻量化三个方面展开研究。首先,与现有的使用标准圆形拟合虹膜内外轮廓的虹膜定位方法不同,为了缓解标准圆形框无法准确定位变形虹膜的问题,本文设计了一个基于旋转椭圆框的虹膜定位模型,该模型在旋
学位
随着经济、科技和医疗水平的快速发展,社会人口老龄化愈发严重,老年群体的健康问题也随之凸显。跌倒已经成为老年群体意外伤害死亡的主要原因之一,若能及时对跌倒进行检测,则可以为救援提供宝贵的时间先机。本文基于计算机视觉技术,分别从人体的姿态建模和动作的时序建模两方面入手,充分挖掘了人体的姿态信息和动作的时序特征,提高了跌倒检测的准确率。首先,在姿态建模方面,现有的跌倒检测方法通常采用人体骨架来表征姿态。
学位
显著性目标检测目的是识别出图像中最吸引人的对象或区域,是计算机视觉领域的重要任务。根据输入数据的类型,现有的显著性目标检测算法可以分为3类:RGB、RGB-D以及光场方法。与RGB以及RGB-D数据相比,光场数据包含丰富的场景信息,能够满足困难场景的信息需求。近年来,深度卷积神经网络的发展取代了传统基于手工特征的算法,显著提高了光场显著性目标检测的性能。然而实际场景中,较高的光场数据获取成本、极为
学位
深度伪造技术的出现和发展使得视频内容的真实性无法得到保证,同时深度伪造内容的迅速传播和受到的广泛关注使其带来的负面影响和潜在威胁日渐严重。因此,深度伪造检测技术的研究对个人隐私的保护和社会信任体系的维护都有着极其重要的意义。本文的研究内容是面向不同质量的深度伪造检测。现有的检测方法在面向经过压缩的深度伪造图像和视频时,检测准确率会出现明显的下降。本文将检测不同程度压缩率的深度伪造图像和视频定义为不
学位
人群计数任务是指对图像中的人数进行准确估计,在交通控制、安全监测和环境研究等方面有很高的应用价值。近年来,研究者们对基于深度卷积神经网络的人群计数方法进行了深入研究,人群计数模型的性能越来越优异。然而,人群计数任务的泛化性问题却研究较少,不具备泛化性的人群计数方法的应用范围十分受限。基于上述研究背景,本文对人群计数任务的泛化性问题进行探索,并提出了人群计数的泛化性方法。本文完成的主要工作如下:(1
学位
手部姿态与形状估计技术在人机交互、增强现实、虚拟现实、智能机器人等领域具有广泛的应用。近些年,随着深度学习的迅猛发展,涌现出大量基于计算机视觉的手部姿态与形状估计方法。尽管这些方法已经取得较高的估计精度,但是它们通常需要借助大量含有3D标签的数据进行训练,而3D标签的获取需要消耗大量的人力成本,因此研究不依赖于3D标签数据的手部姿态与形状的弱监督估计方法是十分必要的。为了减轻网络对3D标签的依赖,
学位