论文部分内容阅读
在表情识别研究中引入卷积神经网络(Convolutional Neural Network,CNN)已经成为近几年的主要技术路线,并且取得了较好的进展与效果,促使面部表情识别(Facial Expression Recognition,FER)逐渐从实验室走向实际应用。虽然现有的深度卷积神经网络在人脸表情识别中取得重要进展,但往往是以增加网络复杂度为代价,这在很大程度上限制了模型的潜在应用,如和谐人机交互等。本文通过对人脸表情识别进行分析与研究,提出了一种基于注意力机制和LSTM的轻量级人脸表情识别网络(lightweight expression network,LENet),实现了人脸表情的快速准确识别。本文主要的研究工作如下:(1)根据人脸表情识别的发展趋势及课题要求,了解相关表情识别网络模型和算法,提出了本文人脸表情识别的总设计方案。(2)对人脸表情学习率进行分析与研究,搭建了ResNet18和ResNet34两种深度神经网络模型用于人脸表情的识别,将SGD、Adam和Adabound优化算法应用到这些网络模型中,并在CK+数据集上采用十折交叉验证方法进行实验。实验结果证明,RestNet34模型在CK+数据集上达到了99.98%的精度。这表明Adabound对表情识别模型学习率调整效果显著。(3)与现有复杂的表情识别网络模型不同,LENet通过设计一个6层卷积神经网络作为基网(Base Net)来提取表情特征,减少了网络参数。并设计了一种基于LSTM的Attention机制,使网络可以聚焦人脸中最具表情鉴别力的区域,提升了人脸表情识别的精度。通过大量的实验分析验证了LENet在1.3M参数量下,在CK+和FER2013两个公开表情数据集上分别取得了99.98%和69.83%的表情平均识别率,尤其显著提高了生气、恐惧和伤心这三类难以区分的表情的识别率,均优于已知经典表情识别算法。