论文部分内容阅读
人脸检测是模式识别和计算机视觉等领域的重要组成部分,也是人脸对齐、人脸识别、表情识别等人脸课题的研究前提。传统的人脸检测算法中,通常利用手工设计的特征提取算法进行人脸的特征提取。在实际应用中,由于人脸存在遮挡、多姿态、角度变化、光照变化及表情变化等情况,基于手工设计特征的人脸检测算法性能及鲁棒性有待提高。针对上述问题,基于卷积神经网络的人脸检测方法得到了广泛地研究,利用传统卷积神经网络进行人脸检测时,通常使用滑动窗口或Selective Search算法进行区域提取,该类方法存在算法复杂、耗时等问题;同时当网络深度达到一定程度时,训练的过程中会出现梯度消散或梯度爆炸的问题,进而导致网络性能的退化。因此,针对传统卷积神经网络在人脸检测中存在的问题,本文对人脸检测算法进行研究,以提高人脸检测的性能及鲁棒性。本文主要完成了以下工作:(1)通过阅读国内外文献,了解了人脸检测及深度学习的研究现状,总结了人脸检测存在的问题,确定了本文的研究方向和研究内容。(2)论文对卷积神经网络的理论知识、深度学习框架和卷积神经网络的优化算法进行了总结与归纳。首先分别从卷积层、池化层、激活函数对卷积神经网络的组成进行了介绍,紧接着说明了卷积神经网络的训练方法,然后介绍了卷积神经网络的随机梯度下降算法,最后重点分析了Caffe深度学习框架。(3)基于经典的Alex Net网络,设计图像分类框架,并对其进行改进。为了增加非线性表达能力,减少参数个数,将原来较大的卷积核替换为两个较小的卷积核,为了解决数据集中图像尺寸不统一的问题,本文把网络的最后池化层进行空域金字塔池化处理。本文引入Faster R-CNN网络中的区域特征提取算法,区域生成网络首先对图像批量生成候选框,利用卷积神经网络对候选框进行优化区域位置和尺寸处理,从而得到分类概率,然后生成代价函数,进而通过反向传播进行参数求导优化,提高区域提取的概率。本文利用FDDB、Wider人脸数据库进行实验,实验显示,所提算法准确率达到98%,平均检测时间为0.32s。(4)本文构建了一个深度残差卷积神经网络,该网络深度达到34层,为了保证网络易于训练和快速收敛,本文引入了一种随机参数初始化方法,该方法使用均值为0,标准方差根据当前层的卷积核大小和卷积核的个数进行计算,所提初始化方式可以加快网络的收敛速度。实验显示,在FDDB、Wider人脸数据库下,本文方法达到了98.6%的准确率。