基于深度学习的快速人脸检测算法实现与应用研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:editorzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸特征作为重要的生物学特征,能够可靠地实现身份识别。传统的人脸识别算法只关注正脸,所以对人脸检测的需求并不突出。随着人脸应用场景被不断发掘,单纯的人脸检测逐渐成为了一个重要的研究方向,尤其在视频内容检测,实时监控追踪等相关行业表现出强大的应用前景。所以如何实现一个高效率的检测模型去接近甚至替代人则成了一个现实问题。目前,深度学习在特征提取方面能力远远优于传统视觉算法,因此,本文立足于传统与深度学习的人脸检测算法,着重于提取不变的特征,实现无关的尺度,生成高效的人脸候选区域,解决样本不均衡以及完善尺度的分配。先设计新的卷积模块来优化网络结构,进而提升检测速度,再改善训练方式进一步提高性能,然后进行广泛的消融实验,最后实现一个检测能力优良,检测速度较快的模型。首先,我们主要是基于MTCNN实现一个级联CNN模型,它先是提升深层卷积的宽度,提高部分特征层的大小以及优化正负样本分配比例来提高模型的检测能力,其次通过将池化层合并到卷积层中进行直接下采样而去减小网络参数以及实现检测速度的提高。然后,基于SSD实现一个锚框人脸快速检测模型,该模型添加了一种或多种策略,包括密集采样策略优化候选区域生成,引入上采样策略优化预测层,利用特征金字塔网络实现尺度无关,采用Context Module进一步增强预测层的表征能力等。在训练中,通过改变交并比来设置不同的样本类型去影响模型的优化,并尝试使用OHEM或者Focal Loss去解决正负样本不均衡而提高模型的检测能力。最后,我们实现了一个无锚框的人脸检测模型,该模型类似于CenterNet,立足于实现基于关键点的检测模型。通过优化网络结构,浅层采用标准卷积的模块,深层采用可分离卷积的模块。此外,基于Mish构建类似CReLU的激活函数。紧接着,我们在部分深层网络设置卷积核大小为5×5以及设置较小预测层。最后在训练中首先采用512×512的输入图像进行初步训练再将图像放大到800进行模型微调。实验结果表明,模型三在检测效果上明显优于模型一,在检测速度上还是优于模型二,而且模型整体相比于前两者较小,相对来说,无锚框人脸检测算法更具有应用前景。
其他文献
为实现高速运动目标的低多普勒探测,提出了双频相干激光的差频光探测方法。对双频激光相干产生的差频信号光学影响因素进行了分析。首先,根据干涉理论得到差频光,结合维纳-辛
上海仲春,杨柳新绿,细雨霏霏,到处生机盎然。美国副总统艾尔·戈尔在访问了北京和西安后,于3月27日下午抵沪。为了同中国学者有更多的交流机会,戈尔副总统特地要求在其总
杨梅味道鲜美,营养丰富,果实含糖12%~13%,有机酸0.5%~1.56%,并含有多种维生素,具有消食、除湿、御寒、止泻、利尿、治痢疾和霍乱等功效.由于果实不耐贮藏和运输,采取加工制作成
由于南北双方相互示强,朝鲜半岛的局势骤然紧张。尽管在国际社会的干预下,双方兵戎相见的可能性在逐渐减小,但由于有关各方的利益纷争较大,相互制衡和斗争激烈,半岛局势将因
干式离合器(Dry Clutch)传动效率高、结构较简单,广泛用于手动变速器与多种新型自动变速器。但是,离合器滑摩过程产生大量摩擦热,尤其在频繁起步和换挡工况,温度急剧升高,易
通过对铝硅合金直接熔炼的研究,说明了铝硅合金直接熔炼的优点及操作的可行性,并指明了操作中应注意的问题.
<正>一、开发背景和意义相比于传统的纸质媒介,在线教务管理具有易于管理、环境友好、可循环利用等优点。对学校教务管理者来说,对成绩的统计繁琐冗杂,非智能化的选课、排课
从并联机构在实际应用中的运动控制出发,对2RPU_RPS构型的并联机构进行运动学分析及仿真。通过分析其结构约束条件,求解出机构的关节变量与末端姿态变量的关系,进而完成其逆
综合论述了电脉冲在细化金属凝固组织方面的应用和研究状况, 从不遇角度对其作用机理做了分析探讨.同时指出电脉冲这一新技术应用前景广阔,但仍需克服多方面的困难,进行更系
随着中国物质经济水平和精神文明的发展,家庭生活水平逐步提高,这是教育培训行业能获得有利发展先机的经济基础和条件。虽然各地出现了一些优秀的办学单位和教育个体,占据着