基于自适应多尺度双向特征融合的目标检测算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jeffersonvon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是在图像中找到被测目标,对目标进行分类并将目标标注出来。随着深度神经网络技术的成熟,越来越多的目标检测应用出现在人们的生产、生活中,例如汽车流量检测、是否佩戴口罩检测、危险区域人员闯入检测等,目标检测技术的应用有着非常重要的实际意义。但是现有目标检测算法往往精度较高或检测速度很快,速度和精度之间往往达不到很好的平衡。基于深度学习的目标检测算法根据是否首先提出候选区域,可以分为二阶目标检测算法和一阶目标检测算法。二阶目标检测算法提出可能存在目标的候选区后进一步检测得到最终结果;在一阶目标检测算法目标检测过程中没有先选出候选区域的步骤,速度更快但检测精度有所降低。YOLO作为典型的一阶目标检测算法,其检测速度快、综合性能出色,因此得到了广泛的应用。YOLO首先需要提取图像特征,然后对其进行融合,对融合后的图像特征进行目标检测和位置定位,得到最终的检测结果。但由于省略了提出候选区域的环节且图像特征融合不充分,因此YOLO的目标检测精度相较于部分二阶目标检测算法有所不足。特征融合的质量对YOLO目标检测结果有着重要的影响,本文在双向特征融合结构的基础上,引入自适应多尺度融合方案,提出自适应多尺度双向特征融合的金字塔结构:BAFPN,并将C2层次的图像特征引入特征融合过程,在YOLOv5m的基础上结合BAFPN提出新的一阶目标检测方法BAFPN-YOLO。本论文的创新点主要有:(1)在FPN(Feature Pyramid Network)的基础上增加自顶向下的特征融合通道,使用双向融合通道对图像不同层次的特征进行融合,引入自适应多尺度特征融合方案,提出新的特征金字塔结构BAFPN,BAFPN结构能够更好地融合图像不同尺度的特征,进而提升目标检测精度。(2)在训练中引入滑动指数平均(EMA),利用一段时间内的权重参数生成指数平均参数,测试时使用指数平均参数作为神经网络的权重,避免模型权重跳跃变化造成模型不稳定,从而使得网络模型更加鲁棒。(3)对神经网络模型进行剪枝优化。BN(Batch Normalization)层中的γ值越小说明该通道或层次在神经网络中的作用越小,γ值低于一定阈值的层次或通道的作用可以忽略不计,可以进行剪枝。对神经网络的通道和神经网络层次同时进行剪枝,能够压缩模型体积,提高目标检测速度。本文所述算法和实验使用Pytorch框架进行训练和测试,BAFPN-YOLO在MSCOCO数据集上相较于YOLOv5m,mAP能够提升3.4%,同时保持较高的检测速度,达到了更好的性能平衡。同时本文设计并开发了抽烟检测系统,进一步验证了 BAFPN-YOLO能够在实际应用中取得良好的效果。
其他文献
随着互联网和多媒体技术的飞速发展,视频数据出现了爆炸式增长,在海量的多媒体数据中占据了重要地位。给定一段视频,大多数人都可以轻松地从中获取很多信息并对其内容进行不同程度的解释和描述。然而,对于机器而言,从视频中提取信息并生成语句描述是非常具有挑战性的。近年来,随着深度学习热潮的掀起,视频描述这一任务在语言和视觉研究领域吸引了越来越多专家和学者的关注。尽管视频描述方法的研究已经取得了显著的进展,但是
学位
20世纪90年代以来,中国进入快速城市化发展阶段,城区规模日益扩大,大量集体土地征为国有、开发成建设用地进入市场,土地价值逐步体现,并在一级市场、二级市场中日益增值。土地征收进入市场涉及集体、农民、政府和开发商等利益主体,土地增值收益应合理分配。目前,各级地方政府在土地征收、出让过程中获得了较高收益,土地受让者在房地产开发过程中也获得了较高收益,而被征收方-农村集体和农民补偿收益较低,权益不能得到
学位
我国是目前世界上果园种植面积和果品产量最多的国家,果品生产在我的农业生产中占据着重要的地位,但在果园管理过程中水肥施用量大,使用效率低的问题相当严重。我国是水资源相对欠缺的国家,实现节水节肥,提高水肥利用效率成为目前果品产业亟需解决的难题之一。水肥一体化灌溉技术是解决上述问题的手段之一,但是,此技术也存在肥料溶解不彻底,极易堵塞喷头降低使用效果。本文采用计算机数值模拟仿真技术,研发一套果园水肥一体
学位
临床路径(Clinicalpathway)是关于临床治疗的一种综合型范式,在循证医学证据和指南的基础上构建对于具体疾病的标准化治疗模式与治疗程序,旨在把控医疗成本,规范医疗行为,提升医疗质量,从而促进治疗组织和疾病管理。许多国家提出了各自的临床路径国家标准,用于指导医生的诊疗过程管理。然而,国家标准临床路径中的项目通常过于笼统,各地医疗机构由于医疗资源的区域化特点,使得国家标准医疗路径无法在本地医
学位
饲草作物的调质处理可以加速其水分蒸发,改变其力学特性和物理状态,减少饲草营养物质的损失,有利于饲草作物的贮藏利用。随着我国“粮改饲”政策的出台及推广,饲草作物种植面积不断增加,饲草加工机械需求量也越来越大。本文在系统分析和总结国内外相关研究的基础上,通过对典型饲草作物力学特性的研究,研制了适用于饲草作物的调质试验台,主要研究内容如下:(1)对典型饲草作物(青贮玉米秸秆、籽粒、紫花苜蓿及王草)的力学
学位
<正> 1913年生于北京市,1934年毕业于燕京大学生物系,1937年在北京协和医学院工作,1942年任北京中医学社社长,1945年任北京中国大学教授,1950年任北京中医进修学校副校长。现任安徽中医学院针灸经络研究所名誉所长、教授,全国中医学会理事,中国针灸学会理事,安徽省针灸学会副理事长,卫生部高等医药院校针灸专业教材编审委员会委员。 1937年进行了神经肌节传导及乙酰胆碱的生物学合成研究,
期刊
我国尾矿库数量、尾矿库灾害事故发生频次均居世界前列。尾矿库安全监测技术能及时测量并提供反映尾矿库安全运行状况的第一手信息和数据,能管控尾矿库当前运行状况,评估预测未来风险发展,从而科学地指导尾矿库生产运行,预防和减少发生事故灾害和环境污染。随着我国对尾矿库安全的日益重视,尾矿库安全监测的重要性日益提升,尾矿库安全监测技术也随之迅速发展。我国尾矿库安全监测技术发展经历了初级阶段、中级阶段和高级阶段,
期刊
<正> 1983年3月25日~26日于意大利首都罗马,在意大利卫生部领导支持下,由最高卫生研究所邀请中国、苏联、美国、匈牙利、印度五国专家教授6人参加国际天然医学讨论会。
期刊
随着科学技术的不断发展,人类即将进入元宇宙时代。扩展现实技术作为元宇宙的核心技术之一,其将为用户提供更好的沉浸式交互体验。手势作为人类最为直观的交互方式之一,其在虚拟现实、增强现实等交互式领域中拥有举足轻重的地位。与此同时,手势已经在手语翻译、机器人控制、体感游戏等各类场景中得到了广泛的应用。因而,手势识别不仅具有深远的理论研究意义,还具有重要的现实研究价值。随着低成本深度传感器的出现,更高效的三
学位
小麦制粉企业在生产的各工段,根据企业自身的生产经营特点、产品市场定位等选用合适的设备和处理工艺,最大程度降低费用,提高产品质量。
期刊