基于RFB和自适应特征融合的小目标检测研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:alex_juve
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域中的一项基础工作,其任务是对图像中存在的目标进行分类和定位。目标检测中对于小目标的检测十分具有挑战性,因为当前目标检测的主流方法仍然是使用深度卷积神经网络,基于深度卷积神经网络的目标检测算法是通过堆叠大量的卷积层提取更高层次的特征信息,来提升模型的检测效果。但由于小目标自身在图像中覆盖面积小、携带的特征信息少的缺陷,经过层层的卷积和池化后,提取到的信息越来越少甚至消失,使小目标的检测精度降低,因此通用的目标检测算法并不适用于对小目标检测精度要求较高的场景。同时一些特殊的应用场景要求能实时检测,因此对算法的速度也有要求。本文针对深度卷积神经网络,研究特征提取、特征融合对小目标检测的影响,以速度较快的YOLO V4为基础算法,提出一种基于群体感受野模块(Receptive Fields Block,RFB)和自适应特征融合的小目标检测算法,提高小目标检测的精度。在PASCAL VOC数据集和NWPU VHR-10数据集上进行了实验,该算法在两个数据集上的检测精度分别达到了87.03%和95.27%,检测速度为26帧/s,精度得到了提升,且速度降幅不大,在多种复杂的场景中实现较好的鲁棒性。本文基于YOLO V4主要做了以下几方面的优化:首先为了解决特征图中小目标信息不足的问题,在模型中融合了浅层特征并添加了RFB模块。由于四倍下采样的特征图中含有更丰富的小目标局部纹理信息,因此将其与八倍下采样输出的特征图融合,并引入RFB模块解决浅层特征图特征提取不充分、感受野小、与深层特征尺度不一致的问题,来丰富小目标信息和上下文信息,提升模型对小目标的检测效果。其次针对目前小目标检测网络在特征融合时使用的简单线性加权、通道拼接等方式难以利用不同特征层的重要程度的问题,本文改进了特征融合方式,设计了一种自适应特征融合方式,通过网络自主学习权重将深浅层特征按权重进行自适应融合,在检测小目标时为不同的特征层赋予不同的权重,实现深浅特征更加高效的融合,提升小目标的检测精度。此外,为了进一步提升小目标检测的精度,针对当前大多小目标检测网络在数据集的预处理方式上难以得到小目标的多样性的问题,本文使用过采样复制粘贴的方式对数据集中的小目标进行增广,强化模型对小目标的训练。为使模型更偏向于小目标的优化,本文还改进了锚框尺度用于提升小目标检测的效果。实验证明本文改进后的小目标检测算法在通用目标检测数据集和遥感小目标数据集中对小目标的检测均取得了较好的精度,检测效率也能达到实时检测,验证了本文算法的有效性。
其他文献
密度聚类从数据对象密度的角度考察数据间的相似程度,并根据相似程度不断扩展直到获得最终的聚类结果。现有的密度聚类算法因适用任意形状的数据集、思想易于理解、可视化能力强被人们广泛应用。但传统的基于密度的聚类算法仍然存在两处不足,一是不能有效处理密度差异大的数据集,二是聚类结果过度依赖参数的取值。本篇论文针对上述不足之处,提出了两种新的改进方法。首先,本文提出了一种基于最近邻的密度分层聚类算法。该算法使
学位
在这个大数据时代,随着智能信息服务应用不断深入人们的生活,网络数据日益膨胀,知识图谱因其强大的语义处理能力与开放互联能力成为当下研究的焦点。知识图谱由于还在发展阶段,大多仍处于不完整的状态。在知识图谱的构建过程中,链接预测是知识图谱补全的重要技术手段。通过对链接预测相关工作的调研发现,现有的方法在多元关系的嵌入表示学习中,没有充分利用其关联结构信息和特征信息,造成许多关键语义信息的丢失,对于复杂事
学位
地表基质是自然资源部于2020年1月18日在印发的《自然资源调查监测体系构建总体方案》首次提出的概念;同年12月22日,自然资源部办公厅印发《地表基质分类方案(试行)》对地表基质的研究进一步细化加深。2次提出地表基质的概念既有共同点,即都是强调孕育和支撑森林、草原、水、湿地等各类自然资源的基础物质,但同时存在很大的区别,即在空间范围的限定和内容的界定上存有一定的差异。笔者对该概念的本质内涵进行深入
期刊
高光谱图像分类是指对像元逐一划分唯一地物标识的过程,在地物勘测、环境调查、军事检测等方面具有重大意义。近年来,深度学习的广泛应用给高光谱图像分类提供了新方法,而高光谱图像由于样本标记困难给网络的训练过程带来了极大难度。域自适应作为迁移学习的分支,是指利用源域的信息实现对目标域的分类,可通过跨域分类的方式解决目标域因标记信息不足而不能高效完成分类的问题。传统的域自适应方法中采用统计度量的方式并不能完
学位
自十八大以来,我国提出“海洋强国”战略,发展海洋经济,提高海洋科技水平已成为我国当前的重要任务之一。水下图像作为海洋信息的主要载体,对于开发海洋环境、利用海洋资源至关重要。但是水介质对光的吸收较为严重,加之海洋环境中浮游生物与悬浮粒子众多,这使得获取到的原始水下图像存在严重的色偏与模糊问题。水下图像中存在的问题严重阻碍了后续基于视觉任务的完成,如水下目标检测、水下设施检查、海洋生态保护等。因此,针
学位
列车可编程逻辑控制单元产品应用现场替代列车大量继电器、接触器,降低运维成本提升安全性的同时,产生了大量输入采集、输出控制、点位监测数据。提出一套针对现场多设备、多物理量、多尺度、多概率的评估方法,并分析了借助数字孪生技术构建列车控制信息模型的可行性。构建了健康管理系统控制信息模型,其中包括关系型数据库和非关系型数据库的构建。目前,LCU应用现场列车内嵌综合健康管理系统已应用于部分城轨列车可编程逻辑
期刊
本文运用文献资料法、归纳总结法等研究方法,主要从实现体教结合到体教融合模式的转变、体教结合到体教融合模式转变的要求方面对高校体育教育模式转变进行研究。
期刊
移动APP设计上存在的用户体验问题使得用户在使用中常会有各种犹豫,或者说用户的犹豫可能意味着产品设计存在缺陷。是否可以将犹豫行为作为线索来改进产品用户体验设计,是一个值得探索的课题。犹豫行为的特点是随时随地发生、行踪不定,难以采用传统的人工用户研究方法来开展研究,需要新的研究方法。本文作者试图借助一种情境感知的用户数据自动采集工具CAUX,探索如何自动识别用户犹豫行为,以及进一步开展用户体验设计的
学位
余华是一位具有强烈抒情和忧郁气质的作家,他的故事中充满了浪漫和诗意。《文城》的行文中也处处透露着余华的这一文学底色。他以对中国苦难人民的叙事为重点,以英雄的失败、艰辛、苦难、命运和宿命的伦理道德价值来表达文化意识和民族精神,体现了人性的力量美,以及作家对美好生活的寄托,即以文学艺术为引,让心灵找回精神归宿。
期刊
人体姿态估计研究的主要内容是从图像或视频中获取人体关键点的位置,当前主要应用于动作识别、安防监控和医疗辅助等领域。近十年来深度学习迅速发展,同时也带动了基于卷积神经网络的人体姿态估计算法的快速进步。在以关键点坐标为学习目标的人体姿态估计模型中,二维坐标无法为模型的训练提供强有力的监督信息,使得模型的学习难度较大;另外,模型需要通过全连接层来输出坐标值,而全连接层的权重严重依赖于训练数据的空间分布,
学位