基于改进分类分数与高斯表达的微小目标检测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:m83692590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在深度学习快速发展的今天,Tiny目标(小于16*16像素)检测依然是计算机视觉中一个很有挑战性的任务,其在航空遥感目标检测和细小瑕疵检测等领域有其独有的应用价值。由于Tiny目标本身尺度极小且常常背景复杂,当前主流的目标检测模型只适用于常规目标,在Tiny目标上往往性能不佳。本文系统分析了Tiny目标的特点,并对现有的目标检测模型进行了针对性地改进。主要研究工作如下:(1)相比常规目标,Tiny目标因其尺度极小且常常背景所占面积大而复杂,这会造成特征提取时对目标的关注度不够;且一般的主干网络拥有较大的感受野,使得提取的特征包含过多的背景信息。针对此问题,本文提出基于注意力机制的Tiny目标检测算法。本算法在主干网络HourglassNet的基础上,设计和增加了基于空间通道的注意力机制模块,加强主干网络对上下文信息地捕捉,并减小网络层数使其拥有更适用于Tiny目标的较小感受野,增强对Tiny目标的特征提取能力,达到提升Tiny目标检测性能的目的。(2)分类分数与回归的预测框不协调问题一直存在于主流的目标检测框架中,这在Tiny目标检测时表现更加严重,会导致大量的误检与漏检。针对此问题,本文提出基于改进分类分数的Tiny目标检测算法。此算法设计了定位分支网络用于估计预测目标框的定位分数,并用此分数改进原来的分类分数,减轻了不协调问题,从而提高Tiny目标的检测性能。(3)Tiny目标像素少,使得IoU对像素的偏移非常敏感,这会造成大量的漏检。针对此问题,本文提出基于高斯表达的Tiny目标检测算法。本算法首先对Tiny目标用高斯分布建模并进行相应地语义标注,使用高斯分布的Wasserstein距离(WIoU)来计算目标的距离,并基于WIoU设计回归损失函数来指导回归分支的训练,这样得到的模型会有更高的回归精度,使得Tiny目标的检测性能得到提升。常用目标检测数据集包含的Tiny目标较少,为此AI-TOD数据集综合了DOTA_V1.5、xView与DIOR等多个公开数据集所包含的Tiny目标数据,用于Tiny目标检测的研究。本文在此数据集上设计和进行了丰富的实验,实验结果验证了本文上述所提算法的有效性,同时也证明了上述算法的综合可以获得更加优秀的性能。
其他文献
车辆目标自主检测是遥感侦察和精确导航领域的关键技术,深度学习成为红外图像时敏目标检测算法研究的主要方向之一,其性能与训练样本的规模和质量密切相关。然而,实际应用中待检测车辆往往为非合作目标,很难获取大量的实际目标红外图像数据,尤其是复杂战场环境下目标多视角图像,网络模型训练面临少样本甚至零样本的难题,且目标成像像素数少。因此,本文提出一套面向少样本目标检测的图像增广方法,设计目标检测网络,并实现模
学位
随着遥感卫星压缩图像下传模式和数据类型越来越复杂,对新型号卫星地面解码系统性能提出了很大的考验。本文研究内容涉及一种高性能卫星图像解码系统软件的设计与实现,其具备兼容多任务模式的扩展性、保证新任务模式下的实时性和应对复杂故障类型的稳定性。对以上三种高性能需求,开展了系统架构的解耦重构、时延分析与优化和系统故障恢复技术的研究。最终在当前某实时卫星图像地面解码系统的基础上,基于新任务模式的任务特点,针
学位
遥感卫星技术的快速发展和相关产业的迭代升级给配套的地面图像处理系统带来了快速部署的要求和挑战。图像实时解码系统是本课题组为某系列遥感卫星研发的支撑系统,属于地面图像处理系统的一部分,负责将传输到地面的压缩码流实时解码还原成图像数据。现有解码系统软件基于不同卫星型号和不同应用阶段定制化开发,通用化程度不高,不利于当前系统的管理维护和后续系统的快速部署。为此本文对解码系统软件进行通用化设计,面向此系列
学位
随着监控设备制造技术的成熟,大大小小的公共安全摄像头如雨后春笋般冒出。公共事务大到刑侦破案,小到社区管理都要借助监控找到目标行人。因此对目标行人的定位和检索具有较大的现实意义。行人重识别研究如何跨摄像头找到同一行人。但这个课题的前提是人已经被检测出来,即在事先存在的行人检测图上开展的。因此行人重识别研究有一个现实问题:实际成像的全景图片中不只有行人还有大量的背景,即行人位置的不确定。所以对于实际成
学位
基于嵌入式平台的机载地面目标检测在电力巡检、交通监控和战场侦察等军民领域有着重要的应用。随着以深度神经网络为代表的人工智能技术快速发展,机载地面目标检测深度学习方法取得了优于传统方法的性能。但是,深度神经网络参数量大、计算密度高,而机载嵌入式平台重量、体积、功耗等资源有限,难以满足目标检测高时效性要求。为此,本文研究了目标检测深度学习模型的轻量化与优化部署技术,设计开发了基于Hi3559A的机载地
学位
随着深度学习在医学图像领域的发展,利用深度学习实现脑CT图像出血区域分割与脑区定位的研究对临床辅助诊断有着重要的意义。对于CT图像脑出血分割问题,由于主流深度学习方法缺乏对医学图像成像规律的设计,当部分脑出血的特征较弱或较小时,分割效果欠佳。另一方面,对于出血脑区定位问题,计算机视觉领域的定位只能给出目标在图像中的坐标位置,尚缺少在医学意义上的脑区定位的研究。论文对上述问题做了深入的研究,论文的主
学位
星载图像压缩,即在卫星上对所获取的遥感图像进行实时压缩,是星地数传通道带宽受限时下传遥感图像的关键环节。但在实际应用中,此过程存在着关键目标信息损失、图像压缩比不可控、硬件实现困难三个主要问题。针对这些问题,本文提出了一种基于红外小目标检测的可控压缩比实时压缩方法,并进行了硬件实现。首先,进行红外小目标检测算法的设计。选择WSLCM算法作为基础算法,针对其在红外扫描遥感图像中应用的局限性进行改进,
学位
如今,海面目标图像/视频在海防边防、海运贸易中都被广泛应用,但是海面的粼光、波浪和较远的观测距离等因素导致海面目标成像受干扰严重,目标像尺寸小、清晰程度低,难以看清。海面目标“看不清”的问题成为了学者们的一个研究焦点,其中利用软件方式进行超分辨率重建、增强目标信息质量成为了一个解决上述问题的重要研究方向。因此,本文对面向海面目标的超分辨率重建技术开展了深入研究。本文以无人机航拍和固定拍摄的方式实地
学位
现代城市安防监控系统能稳定实时地反映被监控区域的真实情况,为维持社会秩序和保护城市安全提供信息支撑。开展城市安防监控系统的相关研究,对提高城市整体防控水平和推进平安城市建设具有重要意义。目前城市智能安防监控系统主要采用固定可见光视频监控对相应区域进行监测,其监控场景固定导致系统难以全局掌握突发安全事件的情况并无法有效定向跟踪事件后续发展,同时可见光成像导致系统在夜间以及雾雪等恶劣天气情况下适用性较
学位
本论文涉及一种面向卫星图像编解码的地面支撑软件平台设计与实现,此平台主要服务于星载图像压缩单机,为研制阶段提供全链路仿真数据以及解码验证支撑,提高研制效率;为在轨服役阶段提供码流数据分析与异常诊断支撑,帮助快速定位故障。论文针对编码速率优化、解码鲁棒性增强以及码流自动检测技术的难点开展研究,设计并搭建了一套具备编码验证、数据实时解码以及码流自动检错功能的软件平台,提供了对星载压缩单机从研制到服役的
学位