论文部分内容阅读
近年来,深度神经网络为图像分类、图像分割、目标检测与跟踪等计算机视觉领域带来了突破性进展。相比较于以先验特征分类为基础的传统机器学习方法,深度神经网络所带来的实质性突破主要归功于其多层次非线性表示架构所带来的高鉴别力特征自学习及整合能力。基于深度神经网络的人脸识别以及性别、年龄、表情等相关属性分析作为计算机视觉领域的一个重要分支,在公共安防、视频监控、人机交互等领域都具有重要的研究意义和广泛应用价值。基于深度神经网络的人脸识别与属性分析系统包含人脸检测、特征提取、识别与属性分析等功能模块,其中提取具有判别性的特征是影响人脸识别与属性分析准确性的关键。除了具备一定规模且高质量的训练数据集之外,影响深度网络高鉴别力特征获取能力的决定性因素又来自于网络架构设计和损失函数设计两个方面。相应地,在充分挖掘多任务相关性的基础上,探寻能够高效、快速地获取高鉴别力特征的网络架构以及设计能够有效约束类内和类间的差异的损失函数是目前该领域的研究热点。由于目前深度神经网络大多只能实现单一任务,多个任务同时进行时面临巨大计算量的挑战,探寻如何使用单模型同时实现多任务,减低计算复杂度,提升模型利用率和效率是目前该领域的研究挑战。同时深度神经网络以损失函数为导向的反向传播优化机制使得多任务学习以更简单优雅的方式实现,如何进行多个相关任务的高效协同处理,提升模型的泛化能力同时有效降低模型大小是该领域研究的难点。基于上述分析,面向实际应用中对人脸识别和属性分析系统的高速、高效、高鉴别力需求,本文在单模型多任务人脸识别与属性分析深度网络架构设计和损失函数设计两方面展开研究。论文的主要研究内容和创新工作概述如下:(1)给出了基于单模型多任务的人脸识别与属性分析算法,其主要思想是首先结合残差网络(ResNet)的高特征表达能力与MFM(MaxFeature-Map)的减少参数的特性给出LightResNet作为单模型的网络结构,该结构可以降低计算复杂度,提升模型利用效率,保障了多任务的实时性;其次单模型的损失函数为以常量λ为平衡因子的SoftmaxLoss与CenterLoss加权和,通过减少类内的差异,从而增加提取特征的可判别性,提升识别率;最后多任务进行微调训练,不仅可以潜在的增加了数据量,同时相关任务的高效协同处理提升了模型的泛化能力。实验结果验证算法在保证人脸识别与属性分析有效性和鲁棒性的前提下能有效的减少单模型参数,降低计算复杂度,提升单模型的利用率。(2)设计并实现了一套完整的实时单模型多任务人脸识别与属性分析的系统。该系统包括视频获取、人脸检测与对齐、特征提取、日志记录、注册、设置等模块,使用单一模型快速的完成人脸认证、表情识别、年龄识别、性别识别以及姿态估计。系统的处理速度为31帧/秒,达到了实时性要求。具有快速、自动、高效的特点。