基于深度学习的口罩佩戴实时检测算法研究与系统实现

来源 :安徽工程大学 | 被引量 : 0次 | 上传用户:lwp2007sh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自2019年12月以来,新冠肺炎疫情肆虐全球,时至今日,除中国以外的世界很多国家的疫情仍然没有得到有效控制,严重威胁世界人民的生命健康安全。呼吸道飞沫是新型冠状病毒传播的主要媒介之一,在公共场所佩戴口罩是防止病毒感染最有简单有效的防护措施。商场、车站等人流量大的场所是疫情防控的重要阵地,为了实现高效智能化的无接触式佩戴口罩检测,本课题开展了基于深度学习技术的口罩佩戴检测方法的研究,具体如下:(1)利用开源的人脸检测数据集,再加上个人拍摄以及从互联网搜集的图片,构建了本文的口罩佩戴检测数据集,共包含经过详细标注的8 700张场景丰富的图片,接着利用聚类算法对数据集进行聚类分析获取合适的先验检测框。(2)针对口罩佩戴检测任务中存在的密集人群、远小目标、遮挡目标等检测难题,提出一种针对复杂应用场景的口罩佩戴检测方法。首先,通过在YOLOv4的主干特征提取网络中引入一种轻量级的通道注意力机制,使得模型能够自适应学习到不同通道特征的重要程度,对不同通道特征间的关系及各自对当前检测任务的重要性进行建模,从而重点关注关键特征信息,同时抑制无关特征的干扰。其次,通过复用空间金字塔池化模块构建了新的特征增强网络,进一步提升了模型在不同的感受野提取并融合空间特征的能力,将全局特征和局部特征进行融合,大大增强了特征图的表达能力。通过实验验证改进后的算法对人脸目标和佩戴口罩的人脸目标检测的平均准确率均值由原来的89.05%提升到了94.81%,且在RTX3090显卡上检测速度依然可以达到39FPS左右,实现了高精度的实时检测。(3)为满足在配置相对低端硬件设备上进行实时口罩佩戴检测的需求,提出一种轻量化的人脸佩戴口罩实时检测算法。首先,将融合了通道和空间双重注意力机制的CBAM模块嵌入到YOLOv4-tiny的主干特征提取网络当中,使模型能够学习特征信息在空间及通道维度的分布,提升模型对关键细节特征的表达能力。其次,引入空间金字塔池化模块对主干网络的深层特征执行多尺度感受野的池化并将所得特征与原特征进行堆叠融合,提升模型对深层特征的融合利用效率。最后,结合路径聚合网络的设计思路,在原有特征金字塔网络的基础上增加一条从低层到深层的特征聚合路径,进一步提升了模型对不同层次特征的融合能力,增强了特征的利用效率。实验结果表明,改进后算法的口罩佩戴检测精度相比YOLOv4-tiny提升了7.47%,且在RTX2060显卡上取得每秒90FPS左右的实时检测速度。(4)利用PyCharm、Python、PyQt等工具完成了口罩佩戴检测的系统设计,实现了静态图片检测、本地视频检测和调用摄像头采集实时视频流进行口罩佩戴检测等功能。经过算法测试和鲁棒性实验,本课题所研究的两种改进型算法的检测性能均有了大幅提升,能够以较高的检测精度和实时性完成多种场景下的口罩佩戴检测任务,实现复杂场景下的高精度口罩佩戴检测,同时轻量化的算法能够满足在普通硬件设备上进行实时检测的要求,进一步降低了算法落地的硬件成本,具有很好的应用价值。
其他文献
鞋作为人类生活中的必需品,其质量问题一直为人们所关注,而鞋的涂胶质量很大程度的影响了鞋的耐用性和美观度。传统制鞋业使用人工手动进行涂胶,不仅涂胶质量难以保证,涂胶的效率也较低,且长期接触胶水会对身体有不可逆的损伤。机器视觉能够在对人有害的场景中工作,效率也更高,被广泛应用于工业生产。因此,本文主要探讨基于机器视觉技术来提取鞋底涂胶轨迹,并使用机器人代替人工进行喷涂作业,以提高鞋底涂胶的质量和速度,
学位
脑肿瘤(Brain Cancer,简称BC)和阿尔茨海默症(Alzheimer Disease,简称AD)是世界卫生组织公认的损害人类生命健康的严重疾病。快速而精确的诊断是拯救无数生命的关键因素。诊断方式大致可归为症状诊断与计算机辅助诊断两种。症状诊断指的是通过医师分析病人病情来判断患病的概率,这种方法较为低效。而计算机辅助诊断(Computer Aided Diagnosis,简称CAD)通过分
学位
振镜控制系统作为高速视觉领域获取图像信息的重要手段之一,已经被广泛运用于生物、军事和体育等场合。并且,振镜控制系统作为一种高精度、高灵敏的控制系统,其作用对象也越来越精密化。其中,在实现对小型高速移动物体的精准捕捉过程中,考虑到振镜控制系统自身的复杂结构、外部的多变环境以及人为的操作误差等因素,严重影响了振镜控制系统的精度和灵敏度。并且传统的控制策略也很难达到系统高性能的控制标准。因此,为了满足振
学位
光伏发电本身具有的间歇性和随机性特点,使得无论是分布式发电还是集中并网,直接接入光伏都会给微网系统带来稳定性、安全性问题,通常需要在微网中加入储能系统增强系统的调节能力以达到平抑系统扰动、维持系统内功率平衡、保持直流母线电压稳定的目的。通过对储能系统辅以合适的控制策略以协调储能单元各自承担功率,能够使光伏微电网能够更好地以灵活、友好的姿态融入智能电网。本文以光伏微电网为研究对象,围绕着光伏出力预测
学位
在这个快速发展和快节奏的社会环境中,人类的日常生活变得越来越智能化。如何实现真正的智能化,移动机器人将更多替代人类的工作,让移动机器人在实际环境下完成任务,需要其可以识别自身在环境中的位置,可见让移动机器人完成定位和建图具备很现实的意义。然而SLAM(Simultaneous Localization and Mapping)技术的发展恰恰很适合应用在定位和建图中。SLAM技术将理论方法引入移动机
学位
近年来受到疫情影响下,“居家”成为了新的热词,同时随着互联网技术的不断发展,人们无论何时何地都可以获取到自身所需求的知识,但仅仅通过文字来获取知识的过程相对单调,短视频的形式为人们所广泛接受,因而短视频知识服务对于用户的影响十分显著。研究表明,视频类别,视频时长以及视频分布类型会对视频影响力产生影响,本文依托于技术接受模型与期望确认模型为依托,对“樊登读书”抖音号其传播内容与用户参与度进行实证分析
期刊
新能源技术不断崛起与更新,交直流混合微电网以其能够兼顾多样的微源输出特性与负载需求并能实现功率的协调运行与灵活控制而备受关注。交直流混合微电网在智能电网中的应用比例也不断提高,然而电网的稳定性也因此受到了新的挑战。“电网友好”型交直流混合微电网的提出因此成为国内外研究者关注的新方向,其主要的控制目标分为三点:1、增强混合微电网的自治运行能力,减少对大电网的依赖;2、最大化利用可再生能源发电;3、保
学位
区别于常见的传统电网模式,微电网不仅是一种更稳定的电能利用模式,还是存在冷热等能源形式转换利用的高效稳定的系统。了解微电网始终不能脱离其主要的运行模式,考虑由不同时间以及不同的实际需求,其工作在并网和孤岛模式之间切换运行是必不可少的工作模式。并网模式的系统内部工作的电压频率等参数几乎由所连接的大电网支持。孤岛模式是由于某些原因引起的系统需要主动断开大电网的行为,系统内部电压频率等参数由于未能连接上
学位
盲源分离(Blind Source Separation,BSS)是指在源信号及混合方式等先验信息均不详的条件下,仅从观测信号中提取未知源信号的方法。随着近年来的发展,BSS开始逐步演变为信号处理领域中的热门话题,并在诸多领域内具有潜在的应用前景。独立成分分析(Independent Component Analysis,ICA)作为一种传统的求解手段,是解决线性混合BSS问题的常规方式。多数IC
学位
视觉同步定位与地图创建(Simultaneous Location And Mapping,SLAM)是指移动机器人在未获取当前环境信息的状况下,使用自身携带的视觉传感器采集环境信息,在运动过程中建立环境感知模型并同时估计自身运动信息。研究移动机器人视觉SLAM环境感知技术对于提高移动机器人在复杂场景实现高智能、高决策有着至关重要的作用,但是纯视觉SLAM算法仅依靠单一视觉传感器在快速运动或弱纹理
学位