工业监控视频中的安全服与安全帽检测方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:luoshibo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
安全服与安全帽是工业生产过程中保障人身安全的防护设备,其穿戴检测研究属于智慧工业建设中重要一环。通过对安全服与安全帽穿戴情况检测,可以对施工作业中的安全隐患及时预警,保障工作人员的生命安全,辅助工业智能化监控管理。在数据集构建方面,基于工业监控视频构建了工业场景中的安全服与安全帽目标检测数据集,总数据标注量共29865张图片,54603个实例。在算法优化方面,对YOLOv5提出两点改进,针对YOLOv5对安全服目标检测准确率较低的问题,考虑使用Efficient Net、Res Net-50、Shuffle Net与Mobile Net等多种算法模型替换原YOLOv5的Backbone模块网络结构,提出了基于YOLOv5的模型融合算法,提高了算法对于安全服目标的检测准确率;针对安全帽数据集中部分目标在工业生产作业区域复杂场景中受到光照变化、多遮挡导致的检测困难问题,以及实际工业环境中的小目标检测问题,考虑对YOLOv5的Head模块改进。通过k-means聚类算法对安全帽数据集聚类,对Anchor的数目与大小进行调整,增加自顶向下网络特征提取过程中的上采样模块,对提取到的特征图进一步扩大,并将深层特征与浅层特征信息充分融合,增强了模型多尺度特征提取能力,提出了基于YOLOv5的小目标检测算法(YOLOv5-Small Object Detection,YOLOv5-SOD)。基于构建的工业场景安全服与安全帽目标检测数据集,选取目前相关领域的最优算法,与优化改进后的YOLOv5算法进行对比实验。实验结果表明,改进后的YOLOv5+Efficient Net算法与YOLOv5-SOD算法在准确率方面均得到显著提升。YOLOv5+Efficient Net算法在工业场景安全服与安全帽数据集中最高检测准确率分别达到96.6%与98.6%。YOLOv5-SOD算法在工业安全帽数据集中最高检测准确率达到98.1%,经过模型推理加速后检测速度达到43FPS。综合考虑算法检测速度、精度与模型体积等多种因素,YOLOv5-SOD算法可以满足工业场景中检测的需求。
其他文献
随着无人机等便携大规模图像采集设备的普及,基于光学相机的三维重建技术在土木工程建设、数字化智慧城市等领域也得到了普及。使用无人机可以一次性采集大量的图像,其实际覆盖面积可达数十甚至数百平方公里。同时,无人机采集也可以非常方便的调节采集图像的高度、覆盖率、倾角等参数。但是采集的大量图像也产生了计算量庞大和计算时间过长等缺陷。尤其在稀疏重建阶段,传统的增量式稀疏重建需要不断进行捆集调整优化也使得重建时
学位
随着计算机视觉技术的快速发展,目标检测和动作检测等技术都慢慢开始发展并普及应用,因此引申出来一个很重要的技术,那就是人体姿态估计。这个技术的实现能帮助计算机快速理解人类动作和行为,并进一步提高人类的生活质量。在实时监测应用场合,自底向上的多人姿态估计方法更全面且更有优势。传统的自底向上多人姿态估计方法中关键点分组通常独立于关键点检测来解决,从而使其无法端到端训练并且具有次优的性能。针对这个问题,想
学位
髋关节疾病已经成为了近几年来严重影响人们生活的重要疾病之一。全髋关节置换手术是治疗髋关节疾病的重要手段,而髋臼窝和股骨头的中心点位置是否定位准确是全髋关节置换手术成功与否的关键。准确地定位出髋臼窝和股骨头中心点具有重要的临床意义。针对CT图像中的髋臼窝和股骨头中心点定位提出了两种方案。一种方案是基于空间配置网络的深度学习定位算法。针对空间配置网络定位精度不够的问题,通过在网络解码器部分引入残差模块
学位
图像中的物体目标检测和姿态估计一直受到广泛研究,并且在许多领域拥有实际应用,比如机器人操控,人机交互,虚拟现实和增强现实等。目标检测提供了图像中目标的类别和位置信息,姿态估计则提供了图像中目标的旋转和平移信息,可以更准确的获取图像中物体的位置。传统方法存在一些局限性,比如基于特征的方法不能很好的处理弱纹理对象;基于模板的方法不能很好的处理遮挡情况。目前基于深度学习的方法是物体目标检测和姿态估计的主
学位
显著性检测旨在模拟人类视觉系统的注意力机制。神经学研究指出人类视觉系统对同步的视听刺激产生的响应要大于单独的视觉刺激,从神经控制的角度表明声音对人眼的关注存在一定影响。然而,以往的视频显著性检测多侧重于视觉信息方面的研究,而忽略了听觉信息的相关作用。将音频引入视频显著性检测研究,可以更好地模拟真实视频观看场景下人眼对视听信息的处理过程,以及人类视觉系统的响应情况。为了更好地体现视觉关注中听觉的影响
学位
随着互联网的快速发展,多媒体数据呈现爆炸式增长,给相关智能分析技术带来巨大的挑战,尤其在计算效率方面。目标检测作为计算机视觉的基础任务之一,也是多媒体智能分析中的常用技术。近年来,深度学习技术的引入使目标检测性能得到明显提升,然而现有目标检测器往往因其庞大的计算量消耗,无法在计算资源有限的设备上充分发挥作用,这对智能产业落地造成了巨大的阻碍。另一方面,针对目标检测轻量化的模型压缩技术尚不成熟,仍有
学位
近年来,随着待解决问题的复杂性增加,神经网络的深度也在快速增长。尽管有不少启发式思路可用于解决深层网络稳定性训练的问题,但他们都缺乏坚固的理论框架支撑,使得定量的说明解释仍然困难重重。因此一种被称作平均场理论的新理论框架近来被广泛研究,旨在为深层网络的稳定训练提供准确的数学证明和解释。但是在诸如生成对抗网络(Generative Adversarial Network,GAN)等无监督模型上,平均
学位
债权人、债务人约定以动产设定质押,但未就交付时间、交付方式等作出约定,而是由债务人通知保管人动产所有权转移给债权人的,可认定双方间成立让与担保合同关系。合同中订有清算条款的,让与担保合同有效。让与担保自债权人与债务人之间有关转让返还原物请求权的协议生效之日起设立;双方未就转让返还原物请求权作出明确约定的,让与担保自债务人通知保管人所有权转移给债权人之日起设立。
期刊
目的 分析第四代Oxford混合型单髁置换术治疗膝关节前内侧骨关节炎的短期临床疗效。方法 回顾性分析2020年10月至2021年9月就诊于江苏省中医院骨伤科的60例前内侧骨关节炎患者资料,均行第四代Oxford混合型单髁置换,其中男20例,女40例;年龄54~85岁,平均(68.43±7.04)岁;左膝32例,右膝28例;身体质量指数19.5~39.1 kg/m~2,平均(25.68±3.55)k
期刊
行人再识别因其在城市安防、智能服务、电子商务等的广泛应用前景逐渐成为了研究热点,但是行人再识别在现实应用中的监控场景十分复杂,行人图像经常会出现遮挡,遭受信息不完整和空间错位的问题,于是行人再识别逐渐衍生出了遮挡行人再识别这一极具挑战又亟需解决的分支。为了解决遮挡问题,本文提出了一种基于像素语义注释与特征不确定性的遮挡行人再识别框架(PSFU),其通过利用精确的外部语义注释和对像素级数据不确定性进
学位