基于YOLOv4的口罩佩戴多类别检测

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:chen2960798
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新冠疫情的肆虐,基于计算机视觉的口罩佩戴检测得到了快速发展。但因为用于疫情控制的口罩自动检测场景复杂,计算资源有限,现有检测算法鲁棒性和实时性差;用于模型训练的数据集比较小,现有数据集缺少未规范佩戴的图像标注,数据集类别不平衡,造成少数类别未规范佩戴口罩检测精度差。针对上述问题,兼顾速度和检测精度,本文从数据集扩充、数据增强算法改进、网络结构优化和损失函数设计等方面开展研究。主要工作如下:(1)建立一个包含多场景、多类别的口罩佩戴检测数据集。数据集拥有14157张图像,共计24286个标注人脸。按照8:1:1比例随机划分训练集、交叉验证集和测试集。人脸目标在尺寸、姿势、光照、遮挡程度、表情等方面有丰富的变化。并且根据检测任务需求,使用Label Img进行详细标注,用于口罩佩戴检测模型的训练测试。(2)提出一种基于动态加权类别平衡损失的口罩佩戴多类别检测算法,解决当下算法普遍忽略检测未规范佩戴口罩,由于数据集类别不平衡导致少数类别检测精度差的问题。以通用目标检测网络YOLOv4为基础网络,设计动态加权类别平衡损失,代替原有的交叉熵损失。以训练时每个批次各类别实例数量的倒数作为主权重,以有效样本数量倒数为辅助权重,动态调整各类损失权重,有效缓解直接使用重加权方法稳定性弱、精度震荡和检测效果不理想问题。与当下主流的兼顾精度和速度的检测算法进行对比的实验表明,基于动态加权类别平衡损失的口罩佩戴多类别检测算法,能够有效提升检测精度,尤其是少数类别的精度相比于基准网络提升6.21%。(3)提出一种基于多尺度空洞卷积融合的YOLOv4-tiny口罩佩戴检测算法,解决在计算资源有限情况下,现有轻量化算法检测精度不高、在各真实场景算法鲁棒性差的问题。针对轻量化算法YOLOv4-tiny的颈部网络设计简单、对特征利用不足、感受野小等缺点,设计多尺度空洞卷积融合模块和上下双向融合模块优化颈部网络。多尺度空洞卷积融合模块并联使用多个尺度空洞卷积进行特征提取,对不同感受野下的特征进行融合,加强上下文信息,提高骨干网络输出的特征利用效率。上下双向融合模块在FPN结构基础上,将低层的细节信息融合到高层检测分支,丰富了各检测分支的语义信息和细节信息,促进后续回归和分类任务的提升。在自制的多类别口罩佩戴检测数据集进行测试验证,实验表明,基于多尺度空洞卷积融合的YOLOv4-tiny的口罩佩戴检测算法能够加强对小目标和遮挡目标的检测能力,m AP相比较于基准网络提升5.5%。(4)为了贴近实际复杂的检测环境,根据口罩人脸图像的特性,改进Mosaic数据增强算法。改进后算法扩增数据集能有效提升少数类别的检测精度,提升复杂背景的检测性能。此外,针对现有算法忽视真实防疫场景天气多变、场景复杂、算法鲁棒性和泛化能力差的问题,提出全天候场景数据增强方法,模拟夜晚、雨天和雾天等场景图像进行数据增强,有效提升模型对各真实场景的检测能力。在自制的多类别口罩佩戴检测数据集和真实多场景数据集进行测试验证,实验表明,使用数据增强后数据集训练的网络模型,能有效提升各真实场景下的检测精度,相比于基准网络,各场景模型性能提升5.5%-10%。
其他文献
在信息化时代中,随着计算机技术的迅猛发展,软件的规模和复杂度呈指数式扩大,然而在享受软件所带来便利的同时也伴随着巨大的安全隐患。对于庞大且功能复杂的软件系统来说,出现缺陷的概率更大,需要消耗大量人力物力资源来进行测试,然而也无法达到百分百测试覆盖,隐藏的缺陷会导致各种致命的软件灾难。为了提高软件测试的效率,并且合理地分配测试资源,因此软件缺陷预测技术成为了软件测试领域中研究的热点。传统的基于机器学
学位
现有的计算机视觉算法很大程度上依赖高质量的图像,但是恶劣的天气情况严重影响这些户外视觉算法的性能,尤其是在暴雨的情况下,拍摄的图像都会有不同程度的失真,导致图像丢失大量的细节信息。在降雨的天气情况下获取高质量的图像,已成为计算机视觉研究的一个热点话题。图像去雨主要是指从有雨的图像中去除雨痕,从而恢复无雨的清晰图像。传统算法依赖先验信息,但是由于雨痕的大小,形状,密度分布不均,并不能对各种场景进行很
学位
论文将感性工学理论引入到智能小家电产品设计中,从叙事学视角探讨如何利用感性因子分析法进行产品设计,以更好满足用户的对智能小家电产品的情感及体验等深层心理诉求。论文首先,梳理了智能小家电发展脉络、用户心理流变、感性叙事理论的发展现状及趋势,阐明了感性工学与智能小家电产品叙事相结合的适配性;其次,归纳了感性叙事的含义、内容及发展趋势,进一步阐述了感性叙事的逻辑成因、组成要素及特征,以厘清感性工学与智能
学位
在社会新形势的推动下,我国旅游业迅速崛起,城市之间的竞争也愈发激烈。为了增加城市综合价值,各个地区都开始挖掘自身特色文化并发展文化创意产业,与旅游业相融合共同促进城市发展。但很多城市为了追求建设效率而忽略了城市个性,毫无主张地照搬模板,导致了城市雷同化尴尬局面的出现。浙江省衢州市作为一座有千年建城史的城市,境内自然资源丰富、文化历史悠久。进入新时代以来,衢州市政府也十分重视城市品牌的建设,明确了要
学位
萍乡市位于我国江西省境内,紧邻湖南省。在古时此地属于三苗九黎部落的生活范围深受巫神文化影响,在之后的时间里萍乡结合地域文化渐渐发展出了独具特色的“萍乡傩文化”。萍乡傩文化作为我国自农耕时代就已诞生的传统文化,具有非常高的文化价值以及艺术价值,是中国古代人民所创造的精神与文化财产,然而随着现代社会的高速发展,萍乡傩文化面临着传承与创新上的危机,宣传上的不足加上以萍乡傩文化为基础的文创衍生产品创新力不
学位
近年来,心脑血管疾病成为了危害人类生命的重要疾病之一,尤其是心源性疾病呈高发趋势,例如发生在任何地点、任何人群上的心脏骤停。及时有效的进行心肺复苏(cardiopulmonaryresuscitation,CPR)治疗成为了患者提高生还机会的唯一机会,而胸外按压是心肺复苏的关键,同时也是基础生命支持(Basic Life Support,BLS)的重要环节。根据国内外大量临床急救实例中发现,急救人
学位
随着移动互联网的快速发展,近年软件规模也呈爆炸式的增长,软件代码量越来越多,百万行的代码软件比比皆是。对于如此大体量的软件来说,如果每一个功能的测试用例都要重新编写,那无疑要使用大量的人力时间成本,这就限制了软件的测试迭代速度。因此,研究如何提高编写高质量测试用例速度对测试人员有着极其重要的意义。本文针对测试用例的特点,引入了知识图谱,利用知识图谱中丰富的语义信息提出了两种测试用例复用的方法。具体
学位
目标跟踪是计算机视觉领域中最具挑战性的研究方向之一,在智能安防、军事制导、人机交互等领域具有广泛应用价值。其任务是根据第一帧中给定的待跟踪目标,在后续视频帧中推理目标的运动轨迹。基于孪生网络的目标跟踪方法兼顾速度和跟踪性能,是目前主流的跟踪方法,但是这类跟踪器的骨干网络存在网格伪影现象,相似性度量函数无法有效区分复杂场景和相似物体干扰下的目标和背景等问题,导致在复杂背景和相似物体干扰下易丢失目标。
学位
目标检测是计算机视觉基础但重要的研究领域,其主要任务是识别输入图像中的目标实例,同时对目标实例进行分类和定位,其本质上是多任务学习。分类任务和回归任务存在固有的特征分布差异性,分类任务需要位置不敏感的特征,回归任务需要位置敏感的特征。本文针对特征表达和任务响应不一致两大基本问题进行研究,从特征增强、采样策略和联合优化等方面提出相关解决方法。本文完成的主要工作如下:(1)提出一种基于回归语义增强和联
学位
图像质量评估旨在量化人类对图像质量的感知,通过分析图像特性,给出质量分数以评估图像优劣。无参考图像质量评估无需获取参考图像,在实际中得到了很好的应用。但当前无参考质量评估任务中数据集较小,深度网络模型提取质量感知特征差,很多方法未考虑深度网络与人眼视觉系统的联系,模型对图像失真敏感性差。针对这些问题,本文提出基于多任务学习提升模型提取质量感知特征的能力,分析网络各层对不同失真的敏感性不同,提出模型
学位