论文部分内容阅读
随着深度学习兴起,卷积神经网络(Convolutional Neural Network,CNN)作为深度学习中人工神经网络的一个重要分支,在计算机视觉领域取得了诸多巨大突破。尤其在目标检测方向,CNN由于其自动提取图像特征的优秀特性,使得检测评价指标不断被刷新。人脸检测属于目标检测中的一个特例,也是人脸应用中关键的一步,在自然环境下,其结果会受到背景、光照、遮挡和表情姿态等因素影响,仍是一个备受挑战和亟待解决的问题。为此,基于CNN的人脸检测算法,特别是基于通用目标检测方法的人脸检测算法不断被改进,取得了很好的效果,能有效应对自然场景下准确率低的问题。本文基于通用目标检测方法:区域卷积神经网络(Region-based convolutional neural network,R-CNN),设计一种多尺度可变形卷积神经网络,实现多尺度人脸检测。R-CNN是一种通用目标检测结构,属于两步检测器,由特征提取模块、候选区域提取模块、分类回归模块三部分组成。考虑到速度与精度的平衡,采用区域全卷积神经网络(Region-based Fully Convolutional Network,R-FCN)作为人脸检测的基本框架,并结合一些最新成果:(1)预训练CNN最后两层被替换为可变形卷积结构,增大了感受野,能有效处理人脸尺度、姿态、遮挡等几何形变。(2)引入特征金字塔网络,应对不同尺度的人脸检测问题。(3)交叉熵损失被替换为焦点损失,处理正负样本量不均衡问题。实验结果表明,所设计的人脸检测框架在多个人脸检测公共数据集均有良好的表现,且比许多现有方法更加优异。人脸属性识别在检测的基础上,进一步对人脸进行分析识别,属于多标签问题。其目的在于针对检测的人脸,对其属性,如关键点、性别、姿态等属性进行识别。基于之前的检测模型,为了将多任务整合到单个模型中,CNN预训练模型提取共享人脸特征,分类回归模块被详细分为了若干任务分支,各分支分别有包含针对各任务特有的特征提取分支和回归器或者判别器。实验结果表明,所提的多尺度多任务人脸检测模型在人脸检测、人脸各项属性识别任务上均能取得不错的结果,优于部分现有方法。