基于YOLOv3和轻量级注意力机制的人脸检测算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zoe8480
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测作为人脸分析的基础步骤,在许多人脸相关的应用中扮演着至关重要的一环,也是计算机视觉任务中一个长期存在的问题。人脸检测是指利用某种特定的方法来检测并准确定位图片或者视频中的人脸位置,因此其检测结果的好坏经常受限于各种外界因素。随着智慧化信息技术的快速发展,人脸检测技术在安防监控系统、非接触式信息采集、移动人脸支付等实际场景下的应用越来越广泛,因此研究检测精度更高、运行速度更快的人脸检测算法有着十分重要的现实意义。本文主要以自然场景下的人脸目标为研究对象,并以卷积神经网络为研究载体,探索在不同网络架构中模型的人脸检测效果,并根据目前人脸检测发展所面临的实际问题,提出两种能提升人脸检测精度和实时性的算法框架,论文的主要工作内容如下:(1)介绍人脸检测技术的研究背景与意义,并对人脸检测存在的技术难点与问题进行分析与讨论,最后调查了国内外人脸检测技术的发展与研究现状,归纳总结不同时期人脸检测技术的原理与优缺点。(2)针对多尺度人脸目标检测召回率低的问题,介绍一种优化的YOLOv3目标检测模型,该方法利用类似特征金字塔的多尺度融合策略,在原始算法三个特征映射图的基础上,增加一次上采样操作,用来扩大网络的感受野范围,从而获取更多的特征描述信息,提高算法检测的准确率;同时基于K-means聚类算法优化锚点框匹配策略,通过对Wider Face人脸数据集进行标注框坐标信息的重新聚类,提高预测框与真实标记框之间的交并比,进而改善网络对人脸目标的漏检情况,提升算法的召回率。(3)为了实现快速检测的目的,本文结合轻量级网络的设计理念改进特征提取网络,用深度可分离卷积替代标准卷积的工作方式,减少网络训练过程中的计算量参数,实现人脸检测速度的实质性提升;同时在残差结构中引入注意力机制模权衡网络的检测速度和检测精度,即在保持计算量平衡的同时重点突出感兴趣区域,加强网络的局部特征表达能力。(4)针对现实场景中大量人脸目标共存时出现的难易样本不平衡问题,提出基于Focal-loss改进新的损失函数,用优化的交叉熵损失函数对置信度误差部分进行计算,该函数可以通过预设调节参数改善简单样本与难分样本的权重比例,进而提升模型训练的收敛速度,使检测结果更加精准有效。通过大量对比实验和不同检测指标的定量性分析,验证改进的两类算法均可以在不同程度上提高人脸检测的性能。
其他文献
目前气象卫星在日常生活中发挥着越来越重要的作用,人们对于卫星观测的精度要求越来越高。随着近年来各国气象卫星发射数量的增多,对卫星场地辐射定标的简便性和可持续性也提出要求。传统的人工观测和单次或几次观测已不能满足卫星遥感器在轨定标和遥感数据定量化应用的需求,亟需将场地的地表和大气光学波段辐射特性观测推向全自动、连续观测的阶段。本文在此背景下,以敦煌卫星辐射定标场为实验场地,对布设在场内的自动化观测设
随着网络社交媒体的迅速发展和人们生活水平的提高,网络文本信息也在迅速发展。微博是目前中国最受欢迎的博客应用,任何时候都在产生大量的数据。这些数据包括大量关于网民感受和态度的信息,若能将情感分析技术应用到微博产生的大量文本信息中,宏观上可以监控和引导网民在舆情爆发前后的情绪走向,从而有关部门能及时采取措施进行防控。同时,文本主题分析,舆情分析也都是以情感分析为研究基础,发掘数据情感价值,有助于完善网
自主移动机器人已广泛应用在多个生产生活领域,并在其中发挥着愈加重要的作用。路径规划是移动机器人实现导航的关键和核心,研究路径规划方法对于保障移动机器人的自主化和智能化水平等具有重要的意义。近年来,基于光学成像的传感器技术(即相机)凭借采集环境信息丰富、性价比高等优势,已广泛应用在机器人领域。当前,传统的路径规划方法通常需要事先构建精确的环境地图,这种方法在面对未知环境时无法有效地实现路径规划,并且
随着我国钢铁生产的不断发展,生产工艺的不断完善,对于操作工人所具备的生产经验有较大的依赖性,同时操作人员的工作习惯等一系列的因素影响,炼钢的效率和优化控制有更进一步的改进空间。传统工艺中取样、肉眼辨温、钢花估碳、验渣估氧硫等操作更是进一步增加了产品质量对生产人员依靠经验操作准确度的要求,故需要将工艺参数信息化,原材料状况数字化,发展智能制造,建立智能自动化的现代型炼钢模式,以减少人工操作、降低生产
车联网是一种新型的移动自组织网,实现车辆与其他通信单元间的信息传输。作为智能交通的重要发展方向,它在事故预警、交通管控以及信息服务等方面具有广阔的应用前景。车联网中多采用广播的方式进行信息分发,若源广播车辆与目标车辆无法直接通信,需选择中继车辆以多跳的方式进行转发,从而实现数据信息的大范围传输。因此中继车辆的选择在多跳广播算法中至关重要。本文介绍了车联网中的关键技术和应用分类,并对现有的广播算法进
随着能源和电力系统的发展,可再生能源的并网,用电设备的接入,电网的规模越来越大,网络拓扑结构也越来越复杂,给故障诊断带来困难。电网发生故障时,及时实现故障的定位和故障类型的识别,对保证故障及时排除,供用电迅速恢复都具有重要的意义。大部分电网故障诊断方法是将故障开关量和电气量作为故障诊断模型的输入进行故障诊断,本文从这两种不同的输入量分别针对不同的问题进行电网故障诊断技术的研究。从故障开关量出发,本
传统的控制任务采用的是时间触发控制。它是指在固定的时间间隔内对系统的状态信息进行采样,并使采样后的状态信号进入系统工作。由于网络的带宽限制,这可能导致控制性能的降低。最近,事件触发控制以其减轻传输负担、节省通信、提高计算效率等优点在控制领域引起了广泛的兴趣,其控制输入仅在违反触发条件时进行更新,降低了执行器的平均更新频率。然而传统的事件触发控制几乎不考虑最优控制。最优是指控制性能最大化和资源最小化
随着新能源汽车以及制造业的快速发展,电动冲击扳手作为汽车组装螺栓紧固或拆卸的重要电动工具之一,其输出扭矩的准确度、工作效率和安全性一直是该领域研究者的研究重点。电动冲击扳手在对不同型号的螺栓进行紧固操作时,不仅要避免由于输出扭矩过大导致螺栓发生形变而损坏,还要防止输出扭矩过小导致螺栓松动脱落,如何能够实现电动冲击扳手定扭矩控制是目前待解决的关键问题。目前,电动冲击扳手输出扭矩的控制方法主要是通过在
手是人类与客观世界交互的重要媒介,人类依赖于手部的多种姿态来操纵物体,与他人交流。最近,越来越多的新兴技术要求同时从单眼(RGB)二维手部图像中精确地识别三维手形网格和三维手部关节点,如人机交互、增强现实(AR)、虚拟现实(VR)、机器人和手语识别等。得益于近年来深度学习的成功,单目三维手部姿态估计取得了显著的成功,如机器可以从单一的二维图像中精确地预测21个手部关节点。然而,从单张RGB图像中重
本学位论文主要针对一类离散时间conic非线性系统鲁棒控制与故障检测进行了深入研究。自1966年Zames提出conic非线性以来,研究者对此产生了极大的兴趣。近些年,关于conic非线性系统的研究成果也层出不穷。作为一类特殊的非线性因子,conic非线性存在于一个超球面内,其中心是线性系统,半径是另一个受线性系统约束的范数。实际上,conic非线性系统在很多非线性动力学中有所体现,例如死区和饱和