论文部分内容阅读
作为人类情感最直观的表达方式,人脸表情及其相关的研究工作已经在医疗、商业以及家庭生活等领域产生了深远的影响。本文对人脸表情系统中的特征提取和分类识别进行了分析研究,对传统主成分分析(Principal Component Analysis.PCA)算法进行了改进,提出了特征空间维数更低的特征提取方式;并根据特征表征人脸的互补性和分类效果的差异性,提出了多特征-分类器优化匹配的识别方法:最后基于建立的动态贝叶斯网络(Dynamic Bayesian Network, DBN)对粗分类结果有分歧的表情图像进一步决策。本文的主要工作如下:(1)针对PCA降维过程中,由于特征值相对集中而造成维数仍然偏高的不足,本文提出了基于最优样本的主成分分析(Optimal Sample-PC A, OS-PC A)降维方法。OS-PCA通过选择训练样本、优化协方差矩阵,从而达到进一步降维的目的。鉴于离散余弦变换(Discrete Cosine Transform, DCT)对光照的鲁棒性,以及局部二值模式(Local Binary Patterns, LBP)对局部纹理特征的有效描述,本文结合DCT和LBP特征来弥补单一OS-PCA特征在人脸表情表征方面的局限性。为了更好地发挥特征与分类器的协作优势,本文构造了一个三层多分类器最优匹配(Optimal Matching, OM)的人脸表情识别模型。首先将OS-PCA、DCT和LBP特征输入模型;然后完成多特征与多分类器的最优匹配;最后执行粗分类结果投票表决,并对仍有分歧的表情图像进行自适应决策,从而得到最终识别结果。(2)针对融合决策时间复杂度过高的问题,本文提出多特征多分类器匹配及动态贝叶斯网络决策的人脸表情识别模型。首先基于训练库,模型完成了多个特征与多个分类器的优化匹配及每个特征-分类器组合混淆矩阵的初始化。然后,将测试样本的OS-PCA、DCT和LBP特征送入模型,得到三个粗分类结果。最后,利用得到的经验信息和建立的动态贝叶斯网络,对仍有分歧的表情图像进行融合决策,并且更新混淆矩阵。实验结果表明,在决策的识别率和时间复杂度方面,基于DBN的决策方法对人脸表情的识别具有更高的可靠性。