基于深度学习的轻量级和多姿态人脸识别方法

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:jonay123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的飞速发展,计算机视觉领域的技术也越来越多的被应用到人们的日常生活中。人脸识别作为计算机视觉领域的一个分支,在深度学习快速发展的同时,基于深度学习方法实现的人脸识别技术也取得了很大的成就。现有的公开数据集中的人脸图像大多是单一姿态(正脸)的人脸,而在实际应用中,需要进行识别的人脸图像可能是多姿态的,单一姿态数据集在多姿态识别任务中无法取得较好的效果,针对这一问题,本文选取800名志愿者,建立了一个多姿态数据集。该数据集包含800人共4000张图像,每个人采集5种姿态(正脸、左侧脸、右侧脸、低头、抬头),采集时每个人所在场景各不一样,所有人也都处于不同的年龄阶层,采集到的人脸图像相对于摄像头的距离也不一样。本文使用的人脸检测算法为多任务级联卷积神经网络(Multi-task Cascaded Convolutional Networks,MTCNN)算法,其网络结构由三个级联的卷积神经网络PNet、RNet、ONet组成。输入图像尺寸越大,图像金字塔的层数越高,从而导致PNet越耗时,本文通过动态调节最小人脸参数固定图像金字塔层数,不论输入图像尺寸大小是多少,图像金字塔都固定为8层。此外,输入图像中人脸数目越多,RNet和ONet越耗时。本文使用depthwise convolution和channel shuffle操作替换原始MTCNN网络的标准卷积优化第二个问题。由于移动端算力不足、计算资源有限,大型深度学习模型无法在其上顺利应用。针对这一问题,本文提出了一个高效的轻量级网络。在训练时,为了提高多姿态数据集对整个特征提取网络的贡献,修改了样本选取方式。在识别时,为了提高多姿态任务中人脸识别的精度,根据人脸关键点判断当前人脸姿态,然后将当前人脸特征与人脸特征数据库中相应姿态的所有特征进行比对,得出人脸匹配结果。实验结果表明,本文提出的轻量级网络在LFW数据集上精度为99.34%,一整套人脸识别流程在处理器为Qualcomm Snapdragon 820的手机上前向推导时间为49ms,接近实时。同时,使用本文提出的多姿态数据集和多姿态识别方法对识别精度也有提高。
其他文献
多输入多输出(MIMO)天线技术是5G无线通信领域的关键技术之一,可实现空间分集、空间复用和波束赋用等性能,可以提高信号传输速率,增大信道容量,提高频谱利用率。但是在尺寸有
脑机接口(Brain Computer Interface,BCI)是一种人机交互系统,不依赖于人的神经通路,通过脑电信号(Electroencephalogram,EEG)和外界进行交流。由于其广泛的应用价值近年来已
柴油机气缸润滑油膜厚度反映了接触面间的润滑情况,可以对气缸内摩擦情况做出评价,对于发动机的运行有着重要的作用。目前测量气缸润滑油膜厚度的方法诸如电学方法的电容法和
传统激光近净成形(LENS)金属增材制造技术一般通过软件将CAD模型切片分层,再根据规划的路径,通过激光扫描和金属沉积实现无模具成形。具有平行分层、熔道高度不变、成形方向
目的:肾脏连续组织切片中的微细结构检测对于基础肾脏学的研究具有重要意义,随着深度学习与计算机辅助技术的发展,通过计算机视觉中的目标检测算法实现肾脏微细结构的识别并
碳纤维增强硅碳氮复合材料(C_f/SiCN)比强度高、比模量高、耐高温、抗氧化、耐磨损以及热稳定性好,是一种极具应用潜力的航空航天热结构材料。前驱体浸渍裂解(PIP)法是制备C_
滑动推力轴承是机械设备中的关键部件,其性能直接影响工业设备的工作效率和稳定运行,如何提高推力轴承的润滑性能至关重要。现在的研究方向主要集中在常规可倾瓦推力轴承的润
反式-1,4-聚异戊二烯(TPI)在加工过程中,伴随着交联程度的增加,材料依次呈现热塑性、热弹性和橡胶弹性。TPI作为并用胶与其他橡胶材料并用制备橡胶制品已经有了相当成熟的研
作为钢铁生产流程的伴生物,钢渣每年的产出量巨大。由于生产技术特点,钢渣当中一般含有8-15%的渣钢,钢厂通过破碎、磁选、筛分工艺来回收钢渣中的废钢铁,加工工艺复杂、设备
当今社会发展日新月异,而我们赖以生存的环境也变得日益复杂,挥发性有机污染气体(甲醛、苯及苯系化合物、甲醇、丙酮等)在生活中随处可遇,时刻危害着人体健康,而且一旦引发疾病