基于深度学习的安全帽佩戴检测算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:helppeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域热点话题之一,它广泛应用在智能驾驶、智慧城市等方面。将目标检测技术应用到安全生产方面,是近年来国家倡导的跨领域结合,检测安全护具的佩戴情况具有重要的意义。传统方法使用图像处理和机器学习进行安全帽佩戴检测,存在检测准确率低、检测速度慢等问题,无法满足使用需求。安全帽佩戴检测使用深度学习技术使检测准确率大幅提升,但现有网络模型在复杂工作场景下仍存在错检漏检现象。本文基于YOLOv3网络模型,研究复杂工作场景下的安全帽佩戴检测算法,具体研究如下:第一,针对目前安全帽佩戴检测算法中存在的密集人群遮挡导致的漏检和错误分类现象,本文提出了一种多部件结合的分类器。根据人物检测框的长宽比、安全帽-人物中心点向量与竖直方向夹角、空间距离比值等因素设计多部件结合分类器。得到的分类器模型满足实验预期效果,有效提高了分类准确率。使用Soft-NMS算法改进YOLOv3中原有的候选框去冗余算法,可以有效的减少同标签目标遮挡所造成的漏检现象。第二,针对复杂工作场景和小目标场景下目标检测准确率低,漏检现象严重的问题,本文提出了一种融合反残差神经网络和注意力机制的安全帽佩戴检测算法。在YOLOv3的特征提取网络Dark Net53中嵌入CBAM注意力机制模块,用来计算特征图通道域和空间域的权重,将权重与输入特征图相乘得到融合注意力机制权重的特征图,提高目标特征通道权重,抑制背景信息通道权重,提高了目标检测的准确率。使用深度可分离卷积替换Dark Net53残差网络中的传统卷积方式,得到反残差网络,有效地降低了特征提取过程中的计算量,提高模型检测速度。最后,通过大量实验验证,实验结果表明本文提出的将反残差神经网络、注意力机制和多部件结合分类器,进行科学融合并设计出的安全帽佩戴检测算法,平均检测准确率达到93.7%,相比现有采用YOLOv3模型的算法检测速度提升21%,检测精度高出5.4%;检测精度相比最新采用YOLOv4和YOLOv5模型的方法分别高出0.4%和1.2%。能够满足大多数工作场景中安全帽检测的实际应用需求。
其他文献
随着日常生产生活对位置服务的需求不断提升,室内定位逐渐成为目前研究热点之一。超宽带(Ultra-wideband,UWB)定位以其厘米级的定位精度成为室内定位的代表性技术,超宽带的定位精度受到非视距传播、多径效应、基站布设等因素影响,尤其是基站的布设阵型直接影响信号的视距传播(Line of Sight,LOS)和非视距传播(Non-Line of Sight,NLOS)、信号到达时间的测量精度等
随着无线通信技术的发展,航空飞行器集群在军事领域的应用逐渐广泛。集群在空中自发形成的航空自组织组网络(Aeronautical Ad Hoc Networks,AANET),覆盖范围广,组网和拆除速度快,抗毁性能强,能够执行更加复杂的任务。由于环境因素的影响和可用带宽的限制,AANET可靠通信对信道的时延和吞吐量有更严格的要求。现在AANET中使用的媒体接入控制(Media Access Cont
长链非编码RNA(简称lnc RNA)在多种生物调节过程中扮演重要作用。一方面,lnc RNA不同亚细胞定位模式让它们能够执行不同的功能,识别lnc RNA的亚细胞位置有利于确定lnc RNA的功能。另一方面,lnc RNA的突变和失调影响多种人类疾病的发展进程,识别lnc RNA-疾病关联有利于揭示疾病的分子机制和探索治疗策略。然而,确定lnc RNA的亚细胞定位及与疾病的关联的生物学实验成本昂
电法勘探是在人工建立的电磁场中,通过观测地下岩(矿)石间所呈现的电磁学性质和电化学性质的差异性进行地质辨识的一种地质勘探方法。电法勘探仪器提供地下勘探信息,物探人员则结合地质资料、岩层构造判断地下矿物质存在的可能性并给出钻井验证的方案。仪器还可为城市工程、地下工程、水利工程等提供科学、可靠的地下构造信息,并作为工程上施工方案的参考资料。传统的时间域激电法存在发射功率大、测点密度稀疏、勘探信息量少、
直接数字频率合成器(DDS)作为雷达系统及通信领域的关键模块,且随着高速数字化时代的到来,其发展迅速、应用逐渐普及。高性能DDS芯片的集成,需要高速、高精度的数模转换器(DAC)。电流舵DAC相对于其他DAC类型具有速度快、精度高、面积小等优点,成为当前较为热门的高速DAC主流结构,广泛应用于DDS中实现数模信号的转换。首先对数模转换器结构进行分析,并对比其优缺点,电流舵数模转换器无需电压缓冲器即
近年来,随着流媒体技术的高速发展,大型开放式网络课程被越来越多的人们关注。相比于传统的线下授课模式,慕课(Massive Open Online Course,MOOC)具有更高的开放性,用户可以根据自身兴趣爱好选择课程进行学习。然而,由于高度的自主选择性和缺乏师生之间的实时互动交流等原因,导致MOOC具有极高的辍学率。较高的MOOC辍学率引起用户规模和平台收益的缩减,从而成为制约MOOC平台发展
毫米波雷达是高级驾驶辅助系统的关键组成部分,随着汽车工业的发展道路上的毫米波雷达也越来越多。在众多雷达系统中,线性调频连续波雷达系统由于成本低、尺寸小和测量精度高等优点被广泛应用于汽车领域。随着毫米波雷达数量的增加以及有限的频谱资源,雷达间相互干扰的问题将会变得更加突出。线性调频连续波雷达之间的干扰可以分为交叉干扰和平行干扰,交叉干扰会增加频域的噪声基底,降低雷达的检测性能;平行干扰会产生虚假目标
抛丸机是制造业对各类异形零件非加工表面进行清理、抛光及强化处理的最常用设备之一,抛丸过程因硬质弹丸的连续高速运动,会同时造成设备内腔构件的迅速磨损。目前各型系列抛丸机普遍存在抛丸效率与设备寿命的矛盾,优化其核心部件抛丸器结构,配合升级整机智能控制技术是提高效率降低损耗的重要途径。研究学习机械、流体、自动控制、计算机应用等相关理论,结合目标抛丸器结构及运行工艺参数,以增效减损为目标制定抛丸器优化方案
基于机器学习方法的数字信号调制解调,可以在不进行载波恢复、滤波处理的情况下,实现在同一个网络模型下对多种数字调制信号进行解调,有助于提高通信系统中信息传输的效率,缓解日益复杂通信环境下硬件电路设计的压力。另外基于机器学习方法的数字信号调制解调,可以在不进行信道估计的情况下,直接将符号序列从衰落信号中恢复处理,有利提高通信系统的频率利用效率。因此,基于机器学习方法的数字信号调制的解调成为近年来研究的
深度相机的低成本化,加上有限的室内场景范围,极大地推动了基于RGB-D图像的室内视觉SLAM的发展。闭环检测与场景地图构建是RGB-D SLAM能够实现定位导航并保持全局一致的重要模块。闭环检测用于识别曾经到过的地方;地图构建用于将观测信息生成点云地图。目前的RGB-D SLAM存在两个方面的问题:一方面,传统的地图构建充分利用场景的几何信息,但忽略了语义信息,限制了机器人的任务能力;另一方面,常