论文部分内容阅读
面部表情识别是一个横跨多个学科的交叉领域,它涉及机器视觉、心理学、神经学以及计算机科学等多门学科。面部表情识别在医疗、智能监控、教育等方面有着广泛的应用前景。随着深度学习的兴起,表情识别也被分成两类算法:一类是基于传统机器学习的算法,一类是基于深度学习网络的算法。传统的表情识别方法包含人脸检测、特征提取和表情识别三个步骤。表情识别在传统学习领域的研究已经十分成熟,近年来研究方向已经由传统领域转到深度学习领域,深度学习网络自动学习人脸表情相关的特征,并将特征提取和表情识别两个步骤合并共同学习,这使得研究者即使没有表情特征等方面的相关知识,也能实现表情识别。但目前表情数据库数据量不足满足不了卷积神经网络参数训练的需要。为此引入迁移学习的方法,本文实验采用“预训练-微调-二次微调”的训练策略。实验中首先利用ImageNet数据库进行网络参数预训练,使网络具有良好的提取特征能力,根据迁移学习方法,利用FER-2013数据库以及扩充后的CK+数据库进行参数微调和二次微调。同时利用多任务级联卷积神经网络进行人脸检测与裁剪,对实验数据进行预处理,减小非表情数据对网络识别效果的影响。本文对Alexnet、VGG、ResNet、GoogLeNet的原理进行介绍并利用这些网络进行表情识别实验。同时,还对残差网络架构以及SVM原理进行了介绍,分析了SVM替代Softmax的可行性,提出了一种基于改进的深度残差网络(Residual Network,ResNet)的表情识别算法,网络架构使用了线性支持向量机(SVM)进行分类。该算法采用小卷积核和深网络结构,利用残差模块学习残差映射,解决了随着网络深度的增加网络精度下降问题,克服了浅层网络需要依靠手工特征,深层网络难以训练等问题;实验通过迁移学习方法克服了因数据量不足导致训练不充分的缺点。该算法在CK+数据库和GENKI-4K数据库上分别取得了91.333%和95.775%识别率。SVM在CK+数据库的分类效果较Softmax提高了1%左右。本文设计了基于残差网络的实时表情识别系统,该系统分别利用Haar、LBP以及MTCNN进行实时人脸检测将检测的人脸送入到残差网络进行实时表情识别。并通过志愿者测试系统性能。