论文部分内容阅读
人脸面部表情蕴含了大量的人体行为信息,是人类表达内心情感的一种最普遍的非语言方式。随着科技、社会的发展,人们的学习、工作以及生活与计算机之间的联系越来越紧密,人们对人机交互的需求也越来越紧迫,因此,人脸表情识别技术越来越成为国内外的研究热点,近年来,基于稀疏表示的方法受到越来越多的关注,并广泛用于人脸面部表情识别中。本文总结并探讨了人脸表情识别所涉及到的一些关键问题,详细介绍了基于稀疏表示的分类方法(Sparse Representation based Classification,SRC),提出了基于最大散度差判别准则和聚类的字典学习、最小化加权的重构误差求解测试表情样本所属的类别,本文主要从以下几个方面进行了分析:(1)面部表情特征提取。详细介绍了HOG特征和LBP特征的提取过程,并简单讲述选择这两种特征提取方法的原因。(2)基于稀疏表示的分类。介绍了稀疏表示分类原理、字典学习、稀疏系数的求解,其中字典学习是稀疏表示分类的关键部分。为了验证稀疏表示分类方法对遮挡具有鲁棒性,分别在无遮挡和有遮挡的图片上进行实验,实验结果表明基于稀疏表示的分类方法对遮挡的表情图像分类也能取得较好的效果。(3)基于稀疏表示分类的字典学习。针对目前稀疏表示分类中字典学习存在的问题和不足,提出了基于最大散度差判别准则和聚类的字典学习方法,通过该方法学习的字典不仅对样本具有较好的表示能力和判别性,同时稀疏表示编码耗时低。并在Cohn-Kanade人脸表情库上进行实验,实验结果表明本文字典学习方法具有较好的性能。(4)基于特征融合的表情分类。HOG特征提取表情图像的边缘和形状信息,LBP特征提取的是表情图像的纹理信息,这是互补的两种信息,因此将这两种特征通过典型相关分析算法进行融合获得新的特征,以此新特征为基础进行字典学习,最后在字典上进行稀疏编码和分类,实验结果证明该算法比基于单一特征的表情分类方法的效果好。