论文部分内容阅读
随着社会的发展和科技的进步,机器人在日常生活中扮演的角色越来越重要,对机器人与人的交互功能提出新要求。我们希望在机器人与人的交互系统中,机器人不仅需要完成人类的指令,而且需要感知人类情感变化。人脸是最重要的人类情感表达途径,人脸表情识别在人类情感分析中占有重要的地位。人脸表情识别系统由人脸检测、表情特征提取和表情分类构成,特征提取是表情识别系统中最关键的部分。由于缺乏有效地表情特征表达方式,表情识别系统在实际使用中效果欠佳。深度学习(Deep Learning)作为层次特征学习的方式,近年来一直受到学术界和工业界的广泛关注,在自然语言处理、图像识别和语音识别等问题上取得很好的效果。本文借助深度模型,对表情特征提取方式进行研究,在此基础上提出三种基于转移学习思想的表情识别模型,并在SRU机器人实验平台上实现表情识别系统。本文主要完成的工作集中在以下四个方面:首先,提出基于转移学习的表情识别模型。该模型利用实现人脸识别的卷积神经网络中人脸特征进行转移学习,实现对中性、惊讶、高兴等七种表情状态的分类。为了构建较复杂的实验环境,选择CK+表情数据库、JAFFE表情数据库、KDEF表情数据集和PICS中表情数据集中明确标签的样本加入表情组合数据库,同时对该数据集中所有样本进行人脸检测和灰度化处理,该模型在表情组合数据库上取得80.49%平均识别率。通过不同遮挡率的表情数据集的实验,证明该模型对遮挡具有较强的鲁棒性;其次,对单个网络转移模型进行改进,提出基于多模型的表情识别模型。该模型从两个网络结构相同、训练集不同的人脸识别网络中提取人脸特征,对7种表情状态进行分类,在表情组合数据库上取得81.02%平均识别率。经过在不同遮挡率的表情数据集的实验,该模型对遮挡的鲁棒性有较大地提升。然后,提出基于多任务的表情识别模型。该模型使用结构复杂的卷积网络完成多种人脸属性分类任务,从该网络中提取人脸特征,识别7种表情状态,并在组合表情数据集上取得92.02%平均识别率。通过丰富的实验,发现人脸属性信息比人脸识别信息更易于表情分类,每种人脸属性信息对表情识别的响应是不同的。因此,在使用多任务转移学习时,应选择与人脸表情有关的人脸属性任务用于提高表情识别效果。同样地,经过遮挡表情数据集的实验,该模型对遮挡也具有较强的鲁棒性。最后,设计和实现在SRU机器人平台上的人脸表情识别系统。该系统由Kinect对图像捕获模块、人脸检测与追踪模块和表情识别模块构成。Kinect对图像捕获模块利用Kinect拍摄外界环境图像;人脸检测与追踪模块实现从Kinect捕获的图像中检测人脸和对人脸区域进行实时追踪;表情识别模块采用基于多任务的表情识别模型进行模块设计。在真实环境的使用中,该系统能够正确地识别7种表情状态。