复杂背景下的小尺度人脸检测算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户：xurizhaoyangdongshen

【摘要】

：

【作者】

：

杨睿

【机构】

：

桂林电子科技大学

【出处】

：

桂林电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

小尺度人脸检测复杂背景人脸检测 SE-ImYOLOv3 SK-EnYOLOv4 注意力机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人脸检测是一种通过计算机算法对输入图像进行人脸目标查找的技术,人脸检测技术在智能安防、人流统计和刑侦破案等场景具有广泛应用。近年来人脸检测借助卷积神经网络技术使得检测精度取得了巨大提升。在实际运用场景中,由于图像背景物体复杂,人脸特征与背景高度融合和人脸目标尺度过小,使得人脸检测精度降低,因此需要对复杂背景下的小尺度人脸检测进一步的研究。论文基于YOLOv3和YOLOv4目标检测模型,研究复杂背景下的小尺度人脸检测算法,具体研究如下:第一,设计了复杂背景下的人脸检测模型SE-Im YOLOv3。采用基于遗传算法的K-means预测框聚类算法,通过遗传算法生成初始点全局最优解,避免K-means聚类陷入局部最优解并降低聚类点随机初始化对聚类结果的影响,使生成的预测框尺寸更加符合人脸目标的大小;其次在YOLOv3模型中引入Se Net通道注意力机制,提高人脸特征的通道权重,抑制背景信息的通道权重;最后对置信度损失函数进行改进,通过对预测值的约束,提高模型收敛速度,防止梯度消失或梯度爆炸。与原始YOLOv3模型相比,所设计的SE-Im YOLOv3模型在Wider Face数据集上的平均检测精度提高约5个百分点,证明该模型在复杂背景条件下进行运用具有较高可行性。第二,设计了复杂背景下的小尺度人脸检测模型SK-En YOLOv4。提出一种将不同的图像遮挡技术分别与马赛克多图组合技术结合使用的数据增强方法,使小尺度人脸数据在Wider Face数据集中的占比从约百分之二十提高到约百分之四十,从而对小尺度人脸特征进行充分的学习;其次在YOLOv4模型嵌入Sk Net卷积核注意力机制,使不同大小的特征图通过同样的卷积核能获得自适应的感受野,更好地利用图像语义信息;最后采用递归网络特征金字塔结构的多尺度特征融合,充分利用网络上层像素信息和网络下层细节特征,提高人脸的检测精度。与原始YOLOv4模型相比,所设计的SK-En YOLOv4模型在Wider Face数据集上的平均检测精度提高约3.5个百分点,所设计的模型对于复杂背景条件下的小尺度人脸检测有较好的效果。本文研究复杂背景下的小尺度人脸检测算法,扩大人脸检测算法的实际使用场景,提高人脸检测算法在背景复杂和人脸目标尺度较小场景对人脸特征的检测精度。

其他文献

基于全波形采样的抗干扰超高密度电法勘探仪研究与实现

电法勘探是在人工建立的电磁场中,通过观测地下岩（矿）石间所呈现的电磁学性质和电化学性质的差异性进行地质辨识的一种地质勘探方法。电法勘探仪器提供地下勘探信息,物探人员则结合地质资料、岩层构造判断地下矿物质存在的可能性并给出钻井验证的方案。仪器还可为城市工程、地下工程、水利工程等提供科学、可靠的地下构造信息,并作为工程上施工方案的参考资料。传统的时间域激电法存在发射功率大、测点密度稀疏、勘探信息量少、

学位

超高密度电法仪时频域勘探全波形采样抗干扰能力勘探深度提高方法

应用于DDS的数模转换器的研究与芯片设计

直接数字频率合成器（DDS）作为雷达系统及通信领域的关键模块,且随着高速数字化时代的到来,其发展迅速、应用逐渐普及。高性能DDS芯片的集成,需要高速、高精度的数模转换器（DAC）。电流舵DAC相对于其他DAC类型具有速度快、精度高、面积小等优点,成为当前较为热门的高速DAC主流结构,广泛应用于DDS中实现数模信号的转换。首先对数模转换器结构进行分析,并对比其优缺点,电流舵数模转换器无需电压缓冲器即

学位

数模转化器分段结构电流舵高速高精度

基于集成学习的MOOC学生辍学预测研究

近年来,随着流媒体技术的高速发展,大型开放式网络课程被越来越多的人们关注。相比于传统的线下授课模式,慕课（Massive Open Online Course,MOOC）具有更高的开放性,用户可以根据自身兴趣爱好选择课程进行学习。然而,由于高度的自主选择性和缺乏师生之间的实时互动交流等原因,导致MOOC具有极高的辍学率。较高的MOOC辍学率引起用户规模和平台收益的缩减,从而成为制约MOOC平台发展

学位

集成学习深度学习辍学预测特征工程注意力机制

车载毫米波雷达抗干扰方法研究

毫米波雷达是高级驾驶辅助系统的关键组成部分,随着汽车工业的发展道路上的毫米波雷达也越来越多。在众多雷达系统中,线性调频连续波雷达系统由于成本低、尺寸小和测量精度高等优点被广泛应用于汽车领域。随着毫米波雷达数量的增加以及有限的频谱资源,雷达间相互干扰的问题将会变得更加突出。线性调频连续波雷达之间的干扰可以分为交叉干扰和平行干扰,交叉干扰会增加频域的噪声基底,降低雷达的检测性能;平行干扰会产生虚假目标

学位

调频连续波雷达相互干扰交叉干扰自回归模型经验模态分解

金属构件表面清理抛丸机结构优化及智能控制研究

抛丸机是制造业对各类异形零件非加工表面进行清理、抛光及强化处理的最常用设备之一,抛丸过程因硬质弹丸的连续高速运动,会同时造成设备内腔构件的迅速磨损。目前各型系列抛丸机普遍存在抛丸效率与设备寿命的矛盾,优化其核心部件抛丸器结构,配合升级整机智能控制技术是提高效率降低损耗的重要途径。研究学习机械、流体、自动控制、计算机应用等相关理论,结合目标抛丸器结构及运行工艺参数,以增效减损为目标制定抛丸器优化方案

学位

抛丸机表面清理工艺流体物场联合仿真抛丸器优化

基于机器学习方法的数字调制信号解调研究

基于机器学习方法的数字信号调制解调,可以在不进行载波恢复、滤波处理的情况下,实现在同一个网络模型下对多种数字调制信号进行解调,有助于提高通信系统中信息传输的效率,缓解日益复杂通信环境下硬件电路设计的压力。另外基于机器学习方法的数字信号调制解调,可以在不进行信道估计的情况下,直接将符号序列从衰落信号中恢复处理,有利提高通信系统的频率利用效率。因此,基于机器学习方法的数字信号调制的解调成为近年来研究的

学位

机器学习解调一维卷积神经网络衰落信道降噪自编码器

面向RGB-D图像的室内视觉SLAM算法研究

深度相机的低成本化,加上有限的室内场景范围,极大地推动了基于RGB-D图像的室内视觉SLAM的发展。闭环检测与场景地图构建是RGB-D SLAM能够实现定位导航并保持全局一致的重要模块。闭环检测用于识别曾经到过的地方;地图构建用于将观测信息生成点云地图。目前的RGB-D SLAM存在两个方面的问题:一方面,传统的地图构建充分利用场景的几何信息,但忽略了语义信息,限制了机器人的任务能力;另一方面,常

学位

视觉SLAMRGB-D场景解析语义分割语义地图

基于深度学习的安全帽佩戴检测算法研究

目标检测是计算机视觉领域热点话题之一,它广泛应用在智能驾驶、智慧城市等方面。将目标检测技术应用到安全生产方面,是近年来国家倡导的跨领域结合,检测安全护具的佩戴情况具有重要的意义。传统方法使用图像处理和机器学习进行安全帽佩戴检测,存在检测准确率低、检测速度慢等问题,无法满足使用需求。安全帽佩戴检测使用深度学习技术使检测准确率大幅提升,但现有网络模型在复杂工作场景下仍存在错检漏检现象。本文基于YOLO

学位

目标检测反残差网络注意力机制安全帽佩戴检测YOLO

小样本目标跟踪算法研究

近年来,随着深度学习的快速发展,基于深度学习的单目标跟踪在算法性能方面也得到大幅度提升,而这一部分的提升很大程度上源于使用深度神经网络提取到的深度特征具有良好的分辨能力。目标跟踪在实际应用中存在以下问题,首先,小样本数据量不足、样本多样性低,导致网络提取到的特征数量有限。其次,在遮挡、形变和快速移动等因素的干扰下,目标跟踪精度低。针对上述问题,提出一种小样本目标跟踪算法,主要研究方向和创新点概括为

学位

目标跟踪小样本卡尔曼滤波孪生网络

多源融合室内定位算法研究与应用

随着移动互联网、地图测绘和室内导航技术发展,基于位置的服务受到了极大地关注。据统计人们平均80%的时间是在室内,数据连接应用平均80%也在室内,在室外广泛使用的卫星定位技术全球定位系统和北斗定位系统仅仅支持室外定位,在室内复杂环境中无法进行精确地位置服务。随着数字化时代的到来,无线技术的迅猛发展,移动技术得到了广泛的应用,人们开始了对室内定位技术的研究和探索。由于单一定位技术存在精度有限、稳定性不

学位

WiFi指纹蓝牙定位PDR定位室内融合定位多源融合算法

复杂背景下的小尺度人脸检测算法研究

与本文相关的学术论文