复杂场景中的小目标检测方法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:ubqazw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉中最主要的分支之一,目标检测已被广泛地应用在监控安全、自主驾驶、国家军事和工业等领域。在复杂的现实场景中,拍摄角度不同、非目标物体遮挡、成像的天气和光照条件等问题,对小目标的检测产生了严重影响,使得准确检测出小目标仍存在巨大的挑战。同时,小尺寸目标缺乏区分自身与背景或相似类别的外观信息,在深度卷积网络中极易丢失特征信息,因此在检测时容易出现漏检和误检的情况。针对复杂场景中小目标检测存在的问题,本文在现有目标检测模型的基础上进行创新研究,主要工作如下:(1)SSD(Single Shot Multi Box Detector)首次将特征金字塔应用于目标检测,从多尺度特征图中检测具有不同尺度和纵横比的目标,是一种多尺度目标检测算法。但网络的浅层特征图中的语义信息匮乏,难以准确分类小目标,导致小目标的检测准确率较低。本文在SSD基础上添加一条由深到浅的递归反向路径,向浅层传递深层特征图的语义信息。在该路径设计了三个模块:深层特征增强模块整合了路径深层多尺度特征图包含的上下文信息以及最深层特征图的语义信息,强化了深层特征信息的表达;为了增强反向路径特征图的语义信息,上采样特征增强模块能够在扩大特征图尺寸的同时,提取特征图的上下文信息;在自适应特征融合模块中,通过引入的自注意力机制融合骨干网络和反向路径的特征图,从而获得新的带有强语义和精确位置信息的特征图。实验结果显示,在PASCAL VOC和TT100K数据集上,提出算法的平均精度均值(Mean Average Precision,m AP)最高达到了92.5%和80.2%,与SSD相比分别提升了14%和11.5%,表明该检测算法提高了小目标的检测准确率。(2)YOLOv5在检测正常尺寸目标时具有较好的效果,但无法捕捉长程的依赖关系,容易遗漏小目标的位置细节信息。本文利用Transformer和注意力机制改进YOLOv5模型,提出基于Transformer和多尺度特征融合的小目标检测算法。该算法在骨干网络中添加Transformer编码器模块提取特征图的全局信息,以低成本代价提高网络提取特征的能力;然后在多尺度特征融合结构中,设计利用通道注意力机制和亚像素卷积的上采样模块,代替原有的上采样操作,降低了特征自深向浅传递过程中的信息损失,并添加4倍上采样增加可用特征,增强深层和浅层特征的融合;最后将结合通道注意力机制和空间注意力机制的CBAM模块添加在预测结构之前,有效解决了网络在特征提取时无注意力偏好的问题。实验结果显示,在PASCAL VOC和TT100K数据集上,提出算法的m AP最高达到了90.6%和83.1%,与YOLOv5相比分别提升了5.4%和8.5%,充分证明了改进后的网络在小目标的检测上性能有了较大的改善。
其他文献
随着我国农业政策的不断完善和农业产业结构的不断优化,政府在推动农业现代化进程中采取了一系列助力农业科技创新的有效措施,取得了长足发展。十四五规划中强调加快发展智慧农业,实现农业的智能化、自动化。因此,研究基于图像的农作物检测与信息提取已成为必要趋势。苹果是我国重要农产品之一,其种植面积和国内外销量常年居高,有极高的经济价值,对农业经济及乡村振兴具有重要影响。自然场景下的苹果果实生长密集且枝叶茂密,
学位
期刊
基于位置的服务(Location Based Service,LBS)因信息技术和定位技术的成熟发展得到了广泛应用。云计算的普遍发展和智能设备的快速发展使我们见证了基于位置服务的网约车行业在过去几年中的稳定发展,服务提供商(Service Provider,SP)将网络技术与传统巡游出租车进行结合,为上亿的用户提供了舒适、安全的出行服务。该类服务能够提供预约和随时随地叫车的服务,为乘客提供了舒适便
学位
针对平转法转体桥梁转体球铰常规设计法忽略不平衡力矩造成球铰设计安全储备不足或后期转体困难等问题,提出考虑不平衡力矩作用下的转体球铰设计方法,以成都某T构转体桥为背景进行研究。采用MIDAS FEA软件建立转体球铰部分有限元模型,分析钢制球铰半径改变对结构受力的影响规律;然后推导不平衡状态下球铰应力计算公式,通过转体结构的受力关系,根据撑脚是否着地的设计目标,按结构对称与非对称,给出球铰半径的确定方
期刊
我国采矿业、重金属冶炼业等一大批基础工业蓬勃兴起,在推动社会进步的同时,也带来了严重的镉污染土壤问题。目前,各国多使用水泥,通过固化/稳定化技术修复镉污染土。但随着污染程度提高,水泥等传统材料的固化能力促襟见肘,并且高能耗、高污染的生产过程也与人们保护环境的初衷背道而驰。因此,研发一种高性低价的新型固化材料具有重要意义。本文以固化镉污染土的工程性质为导向,以典型工业固废赤泥、电石渣、磷石膏为主要试
学位
苹果产业作为我国水果产业的重要组成部分,其规模和产量逐年增加,但目前在培育的质量和技术方面仍存在缺陷。为了提高苹果果实产量除了要做好土壤、施肥及病虫害方面的管理之外,在不同花期进行人工干预可以有效提高坐果率和果实品质。因此,进行苹果花朵生长状态的自动检测与花期分类的研究具有重要的理论意义和应用价值。近年来,国内外已经对经济林果的自动观测展开了一系列研究,利用计算机视觉技术可以实现作物的物候期检测和
学位
预应力混凝土连续箱梁转体施工包含墩底转体法和墩顶转体法两种,与常规的墩底转体法相比,墩顶转体法有以下两个主要优势,首先墩顶转体减小了转体重量,降低了转体系统的设计难度;其次球铰设在墩顶,减小了承台的结构尺寸,降低了对既有线的施工干扰。文章以张呼铁路集宁南特大桥墩顶转体法为工程背景,采取严控球铰安装精度、平行于既有铁路悬臂浇筑、对梁体称重和配重、试转优化等一系列措施,极大地降低了墩顶转体法施工中的安
期刊
以济南大西环上跨京沪铁路立交桥为例,研究了上跨施工过程中对京沪铁路实施的监测方案、方法,通过对铁路设施设备进行自动化监测,对转体前、转体中、转体后的监测数据进行分析比较,将因转体施工引起的铁路设施的一系列动态信息以及变形数据反馈至设备管理单位与施工单位,为转体过程提供可靠的数据依据及支撑,确保整个转体过程中的施工安全。
期刊
随着我国建筑行业的发展,预应力高强度混凝土(PHC)管桩应用范围已经逐渐扩大到抗拔桩基础。PHC管桩作为抗拔桩的主要作用机理是依靠桩身与土层的摩擦力来抵抗轴向拉力,目前轴拉作用下管桩抗剪性能方面的研究比较少,轴拉力对管桩抗剪承载力的具体影响尚且未知。在实际工程中,抗拔桩在拉拔荷载和水平荷载的共同作用下可能发生受剪破坏,受剪破坏比受弯破坏的脆性特征更加明显,管桩一旦受剪破坏,对上部结构的支承能力会大
学位
元宇宙为高校图书馆联盟的服务创新提供了深厚的技术底座。ChatGPT等新技术的出现,更是为元宇宙的实现注入强大动能。在虚拟与现实的深度融合下,高校图书馆联盟消除时空界限,改变一个个独立高校图书馆互不相干的“信息孤岛”现象,共享联盟内AI生态,为读者带来全新的服务体验。文章从虚拟环境、虚拟馆藏、虚拟馆员三个维度展开,聚焦揭示我国图书馆联盟的环境变化,并提出元宇宙视域下高校图书馆联盟的服务生态网:突破
期刊