论文部分内容阅读
人脸表情识别(Facial Expression Recognition,FER)技术作为计算机科学与人机交互领域一个重要组成部分,受到了众多学者的重视。人脸表情识别技术实际是一门综合性学科,开始应用于生理学、心理学、模式识别等领域。本文详细阐述了表情识别技术中涉及的几个核心技术点:特征提取与降维、分类等,讨论并总结了几种典型方法的优缺点,针对某些方法存在的问题提出了解决方法。主要研究了如下内容:1.针对局部三值模式(Local Ternary Pattern,LTP)缺少对图像全局形变、轮廓特征描述的问题和离散余弦变换(Discrete Cosine Transform,DCT)缺少对图像局部纹理特征描述的问题,提出融合LTP和DCT的表情特征提取方法。首先将单层二维离散haar小波变换应用于人脸图像以获得信息量较少但有效的低频图像,对每块图像使用LTP算子以获得用于表情识别的LTP特征;然后将离散余弦变换应用于表情图像以获取低频系数,此系数即为用于表情识别的DCT特征;然后使用快速主成分分析(Fast Principal Component Analysis,Fast PCA)方法实现LTP和DCT融合特征的有效降维以获得完整有效的面部表情特征;最后利用支持向量机(Support Vector Machine,SVM)进行分类识别。实验结果表明,所使用的方法在识别准确率上优于单一全局或局部特征。2.针对传统的基于稀疏表示的表情分类方法识别率低的问题,提出基于融合特征与稀疏表示的分类方法。较其它特征而言,融合LTP和DCT后的特征更能完整的描述人脸表情图像,因此采用该融合特征作为与稀疏表示分类器(Sparse Representation Classifier,SRC)相结合的一种特征,得到一种新的基于稀疏表示的表情识别方法。实验结果表明,基于融合特征与稀疏表示的表情识别效果优于传统的基于稀疏表示的分类方法。