论文部分内容阅读
大数据蕴含大发展,结合不断提升的高性能计算机更是给机器视觉技术带来日新月异的发展。深度卷积神经网络也正是借着这股力量才大放异彩,其主要应用包括语音识别、图像处理、自然语言处理等。本文就当前大环境下研究了卷积神经网络模型在静态环境下人脸识别领域的应用。相对传统人脸识别方法而言,卷积神经网络模型不需要人工进行大量而又复杂的特征提取算法设计,仅需要设计一个可行的网络模型,再将大量的人脸训练数据集加载到网络模型中,然后进行自动训练,这样就可以得到很好的识别率。把训练好的模型保存下来,那么这个模型就是一个端到端的人脸特征提取器。该方法虽然操作简单,但是需要根据训练数据集设计合理的网络结构,而且最难的关键点是超参数的调整和优化算法的设计。因此本文结合残差网络和融合网络构建了两个与计算资源和数据资源相匹配的网络模型,并通过反复调整超参数和调试优化器使其在训练集上能够收敛,最终还取得较好的识别率。本文的主要研究内容和创新点如下:1.介绍了卷积神经网络的基础理论知识。卷积神经网络本质上是深层次的稀疏的传统人工神经网络,因此本文先从传统人工神经网络的模型结构、前向和反向传播算法进行了详细的分析;然后过渡到卷积神经网络的相关理论,对其重要组成部分如卷积层、激励层、池化层和全连接层进行了具体的阐述;最后对卷积神经网络训练时的一些注意事项进行了说明。2.对深度学习框架TensorFlow的系统架构和编程模型作了一些说明,并对人脸数据进行预处理,包括人脸检测、数据增强、图像标准化和人脸中心损失。3.提出了基于改进的MyVGGNet和MySqueezeNet网络的人脸识别。首先分析了模型VGGNet-16和SqueezeNet的网络结构及相关参数,然后本文提出将原VGGNet-16和SqueezeNet的网络结构和参数进行优化,并在每个卷积层和激励层之间添加批归一化层,在VGGNet-16网络末尾用1个1×1的卷积层代替三个全连接层,还增加全局平均池化层,得到新的MyVGGNet和MySqueezeNet模型,最终这两个模型不仅解决原模型对硬件要求高、有限数据量产生过拟合等问题,还成功应用到人脸识别的任务中。这样就迁移了原网络,在人脸识别任务中更容易获得最优解,最后在LFW数据集上分别获得94.3%和95.1%的准确率。4.提出了基于二叉树型融合网络BTreeFuseNet_v1和BTreeFuseNet_v2的人脸识别。首先对深度神经网络的优化问题和融合原理作了分析;然后结合残差学习,融入分支并行、融合和级联三种结构,采用ReLU函数、BN层、Dropout层、哈维尔方法和截断高斯函数初始化方法、Adam优化器等技巧,构建了两个层次深度为22和19的网络模型BTreeFuseNet_v1和BTreeFuseNet_v2,并详细说明了这两个网络模型的基本构成、整体架构和模型参数;最后在FaceScrub数据集上连续训练,同时调整网络参数,获取较好的模型,再在LFW测试集上进行人脸验证,并且分别取得94.9%和95.5%的准确率。