基于YOLOv4的多场景小目标检测

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:outerwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小目标检测的应用场景广泛,也是目标检测与识别的研究难点,因此,提高小目标检测的精度具有重要的理论和现实意义。然而,现有的目标检测算法在小目标的检测任务中效果差强人意,为提升该任务的检测精度,本文提出一类基于YOLOv4(You Only Look Once version4)模型的泛化改进算法,通过结合空间注意力和通道注意力网络来增强目标特征图的权重,并将其命名为混合注意力网络(Mixed Attention Network,MA),我们将改进后的网络称为YOLOv4-MA(YOLOv4 with Mixed Attention)。针对小目标检测过程中存在的漏检和误检问题,YOLOv4-MA算法从特征提取与特征融合的角度来提高小目标的检测精度,并且在行人重识别、人脸识别等领域得到了应用。论文主要包含以下内容:特征提取和特征融合。本文首先介绍了小目标检测的研究方法和研究意义以及国内外的研究现状。针对小目标特征表达能力弱、样本失衡和分布不均等难点,从特征提取的角度,本文提出一种新颖的注意力模型MA,用于提高小目标类别在特征图中的权重。同时,在训练前通过优化Mosaic增广算法和利用KMeans++对小目标数据集进行二次聚类来提高模型的鲁棒性和检测精度。最后,本文利用聚焦且高效的交并比损失函数(Focal and Efficient Intersection Over Union,Focal-EIOU)替换完全交并比损失函数(Complete Intersection Over Union,CIOU)来缓解小目标特征传递过程中的梯度爆炸问题。本文在增广后的PASCAL VOC和Visdrone数据集上进行大量对比实验来验证YOLOv4-MA算法的有效性。除上述内容外,本文从特征融合的角度对YOLOv4-MA网络进行优化。由于小目标并不单独存在,往往与背景和其他目标存在一定的关联,从而本文设计出感受野更大的膨胀卷积模块(Dilated Convolution Module,DCM)来挖掘特征图的关联信息。同时,在YOLOv4-MA网络的颈部增加反卷积模块(Double Deconvolution Module,DDM)来提高语义信息的融合能力。最后,利用性能更优的注意力引导的特征金字塔网络(Attention-guided Context Feature Pyramid Network,AC-FPN)替代路径聚合网络(Path Aggregation Network,PANet)中的FPN。在增广后的PASCAL VOC和Visdrone数据集上经过大量对比实验来证明优化方案的有效性。
其他文献
漏波天线由于其高定向性、结构紧凑且不需要像相控阵那样复杂和昂贵的馈电网络而备受关注。随着人们日益增长的对无线系统的需要,漏波天线迎来了新的挑战,如何提高其性能并且丰富其功能成为一个重要的研究方向。人工表面等离激元作为存在于亚波长周期结构表面的电磁波,其拥有强场束缚性、可调制的色散特性和高频截止特性等特点,可用于漏波天线的设计。因此,本文基于人工表面等离激元的优势,分析和研究了传统漏波天线存在的低扫
学位
组合测试旨在检测由影响软件系统的各种因素之间相互作用引起的潜在故障。在执行组合测试时,通常的步骤是首先生成一组测试用例来覆盖每个可能引发故障的交互,接着在检测到故障后识别导致故障的交互。尽管这种执行方法简单明了,但有研究表明在实践中并不是理想的选择。这是由于在测试用例生成阶段,测试人员希望测试用例集不仅能够对组件中某些关键参数间的交互关系进行全面的检测,而且尽可能生成较少的测试用例集;在缺陷定位阶
学位
在能源危机及全球变暖的大环境下,为促进节能减排,电动汽车行业得到了快速发展。锂电池作为电动汽车的主要动力来源,通常由电池管理系统(BMS)进行监测与管理。作为BMS中的关键指标之一,电池荷电状态(SOC)表示电池当前容量与满容量的比值。对SOC的精确估计可延长电池循环寿命,降低电池容量衰减速度并使电池以安全状态运行。本文以三元锂电池为研究对象,对电池进行建模和参数辨识等工作,并重点研究SOC估计方
学位
随着互联网技术的日渐成熟,传统通信网络所提供的信息服务已经无法应对信息量骤然剧增的现象,因此全光网络凭借中继距离长、信息容量大、传播速度快和损耗低等优势应运而生。全光网络的质量取决于光信息处理器件的性能,光分束器和全光编码器作为光信息处理器件的关键组成部分,成为了重点研究对象。近些年来,光子晶体凭借体积小、易于操控光传播方向和结构简单等特点,在光子器件的设计领域具有重要的应用价值。本文基于光子晶体
学位
磁性隧道结作为一类自旋电子器件已被成功应用于信息存储等领域中。在磁性隧道结器件设计中,势垒层材料的选择对其性能有重要的影响。传统的氧化物势垒层存在界面光滑度低、制备工艺复杂、成本较高等缺陷。与之相比,近年来新兴的二维材料易制备且不存在表面悬键,可以克服以上缺陷。因此,二维材料势垒层磁性隧道结逐渐得到了人们的关注。在典型的二维材料中,MoS2具有特殊的能带结构:其带隙大小可由原子层数来调节。如果将M
学位
近年来随着天地一体化信息网络和卫星互联网的发展,人们对卫星通信的业务需求呈爆炸式增长,而高通量卫星采用多点波束和频率复用技术,使得比传统多波束卫星具备更大的通信容量,能够较好的满足当前不断增长的业务需求。然而在高通量卫星通信系统中,分配给各个波束的功率和频率资源是相对固定的;此外,由于卫星业务存在时空分布不均匀性、业务类型的多样性等因素,以上问题使得卫星资源分配缺乏灵活性,从而引起通信资源的浪费。
学位
物联网应用涉及的领域越来越宽泛,包括智能电网、智能家居、智慧城市、可穿戴设备、电子健康等。数百亿甚至数千亿的设备将通过物联网连接起来。此类设备无需任何人工控制便可以收集信息、分析数据甚至做出决策,这无疑给攻击者带来了可乘之机。在这种情形下,保障物联网的安全性是一个重要的需求。特别是考虑到物联网系统中存在未通过身份认证的恶意设备,这些恶意设备可能对参与到物联网环境中的人和物造成损害。因此,身份认证尤
学位
微透镜阵列是近年来的研究热点之一,已在各个领域有着较为广泛的应用。有机电致发光二极管(Organic Light Emitting Device,OLED)作为近年来发展迅速的一种光源,它的优点包括视角广、光谱接近自然光、能耗低、寿命长、发光效率高,可柔性显示等等,被认为是继液晶显示(LCD)后新一代的照明和显示器件。但是由于OLED器件衬底与空气介质之间存在较大的折射率差,光子产生了反射与折射的
学位
在当今社会,管道结构的应用非常广泛。如下水道排水管道,自来水厂输水管道,天然气输送管道等等。这些应用在各个领域各个角落的管道,将整个人类社会连接起来,其重要性不言而喻。这些管道若是出现损伤,又无法及时准确得检测出来,将会给社会与国民经济造成重大损失。在此背景下,对管道结构进行损伤检测具有重要意义。在目前结构健康检测技术中,超声导波无损检测技术具有检测效率高,成本低等优势,已在管道结构上实现了一定范
学位
随着移动互联网的快速发展和物联网的出现,未来的移动通信技术必须要具备高速无线通信、无缝连接、强安全性和超低延迟通信的能力。然而,传统的射频网络由于频谱资源匮乏,无法满足这些高要求。因此,可见光通信(Visible Light Communications,VLC)技术由于具有频谱资源丰富、高数据速率、绿色环保、无电磁干扰、保密性好等优点,近年来已经成为工业界和学术界的研究热点。目前,已经有许多工作
学位