基于锐化注意力的快速目标检测算法及其在遥感场景下的应用研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:JK0803_liuchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉的一个重要研究领域,近年来在深度学习技术的发展下,不断有基于神经网络的目标检测算法涌现,而如何提升目标检测网络的性能是一个热门课题。注意力机制已被证明具有提高深度卷积神经网络性能的巨大潜力,但是许多现有方法并未考虑如何将其应用于轻量级网络,而添加复杂的注意力模块会增加计算复杂度,降低检测速度和效率。在YOLOv5s的实验中,本文发现嵌入CBAM(Convolutional Block Attention Module)时空注意力模块劣于嵌入SE(Squeeze-and-Excitation)通道注意力模块,其空间注意力模块对模型的平均精度造成了一定的负面影响,有待进一步的提升。本文的研究目标是构建即插即用的空间注意力模块并提供合适的时空注意力机制,使其在轻量级网络中展现较好的性能提升。本文的主要工作以及创新点总结如下:(1)通过在空间维度上引入锐化滤波方法,本文提出了一种即插即用且具有低复杂度的锐化空间注意力(Sharpening Spatial Attention,SSA),旨在识别并加强目标物体在空间维度上的存在感,并在YOLOv3-tiny和YOLOv5s网络上进行了各种对比实验。为进一步提升网络性能,本文又提出了一种时空锐化注意力机制(Spatio-temporal Sharpening Attention Mechanism,SSAM)。SSAM机制融合通道注意力和锐化空间注意力,在保证模型检测速度的前提下,很好的提升了模型的目标检测性能。在通用目标检测数据集VOC2012和COCO2017上,本文得出了一种较佳的嵌入方案并对输出特征图进行了可视化,验证了锐化注意力的有效性。(2)针对遥感场景下的快速目标检测问题,本文在遥感数据集DOTAv1.0上进一步测试并验证了SSA模块的泛用性,调整了SSAM机制的具体方案,并进行可视化实验,从特征图角度解释了SSA模块的作用。实验结果表明所设计方法在不牺牲检测速度的前提下实现了平均精度的明显提升,同时模型参数量基本保持不变,证明了SSA模块和SSAM机制在轻量级网络YOLOv5s中的有效性,进一步说明了在深度卷积神经网络空间维度上引入锐化滤波方法的有效性。
其他文献
伴随着互联网技术的持续发展,物流运输业正处于高速发展的阶段,而仓储行业作为物流运输业中的一个重要组成环节,也愈发受到重视。目前部分仓储系统的信息易篡改、流程不透明、中心化严重、缺乏信任等问题逐渐暴露在人们面前,不断消耗着人们对仓储系统的信任度,如何提高仓储系统的安全可信性和货物溯源的能力,已经成为行业内亟需解决的问题。区块链技术作为一种新技术,具备去中心化、可信任、透明公开等天然特性,让其在仓储领
学位
学位
推荐系统通过分析用户的兴趣爱好,从互联网的海量信息中挖掘用户可能感兴趣或需要的信息资源或物品,从而为用户做出相应的推荐。目前主流推荐方法对于数据密集型任务有很好的推荐效果,但在某些实际场景中,因收集成本较高等原因而难以获得足够的数据,不充足的样本易导致过拟合、模型表达能力不足等问题,进而影响推荐效果。因此,需要研究基于小样本数据的推荐方法以缓解数据有效样本不足的问题。目前小样本学习已用于解决机器学
学位
血管性痴呆(vascular dementia,VD)一病复杂多变,虚实夹杂。伴随我国人口老龄化,血管性痴呆这一疾病已成为中老年人群的常见问题之一。中医治疗血管性痴呆既着眼于整体,又侧重于局部病情变化,达到辨证合一的目的。近年来,国内外对VD的发展现状、病因病机、辨证分型及中药治疗等方面进行了大量的研究,本文对此进行论述。
期刊
随着可编程逻辑控制器(Programmable Logic Controller,PLC)功能的不断拓展,涌现了各种各样特殊的功能块。在使用这些功能块编程时,开发者难以设置合适的程序运行周期,而运行周期决定了实际场景下任务是否有序执行。为了解决这个问题,需要事先预测功能块执行时间。但目前现有方法存在局限性,只能够针对其中一部分功能块进行预测。因此,本文结合机器学习提出了基于特征的功能块时间预测方法
学位
步态是人行走时的一种姿态,也是下肢最基本的运动特征。由于表面肌电信号(sEMG)中蕴涵着丰富的运动信息,可用来区分人下肢运动时动作的各个阶段,因此利用sEMG信号对不同的动作进行分类识别得到了广泛的研究。本文主要从五个方面进行研究,即在表面肌电数据采集、信号消噪处理和特征提取的基础上,分别采用DNN算法和CNN-LSTM算法,进行步态优化算法识别。以下是本文的主要研究工作和创新点:(1)sEMG信
学位
信息时代的来临,给人们的工作方式和工作方式提供了新的可能性和途径,也促进了人们的工作观念和工作方式的更新和转变,使社会得到了巨大的发展,教育作为一个重要的前沿学科,也需要不断地更新、完善和升级,才可以培养出符合时代需求的专业性人才,而在所有的教育专业当中,会计专业具有一定的特殊性,首先会计专业是公司的财务人员,对人员的要求比较高,其次,中职教育是一种特殊的职业,中职学生的知识储备要比高职院校的学生
会议
随着科技产业的发展,软件产品被广泛地应用于人类活动。软件产品在人类生活中扮演的角色越重要,意味着软件缺陷的存在对人类生活造成的危害就越严重。软件缺陷预测可以帮助测试人员有效地识别缺陷和合理地分配测试资源。即时软件缺陷预测是软件缺陷预测的新思路,以软件研发人员每次提交的代码变更为对象,对变更是否引入缺陷进行预测。即时软件缺陷技术根据预测过程中是否进行模型更新分为离线和在线两个场景,在线场景中模型进行
学位
血管性痴呆是继发于中风病而引起的痴呆,是脑血流灌注异常导致脑机能衰退的结果,多呈阶梯样进行性加重。血管性痴呆重在预防,早期发现,早期诊断,早期治疗。
期刊
基于电磁矢量传感器的参数估计方法不仅能够获取辐射源信号的空域和极化域信息,而且具有较强的抗干扰潜力,在近几年受到广大学者的关注。然而,现有的电磁矢量传感器阵列大多呈线性结构,无法获取入射信号的全部信息;与此同时,以标量阵列为基础的参数估计算法在矢量阵列的拓展应用中,其算法复杂度较高,且在低信噪比情形下的参数估计性能较差。因此,论文对电磁矢量传感器阵列的空间结构以及参数估计算法进行研究,提出了针对不
学位