论文部分内容阅读
近年来,随着社会的发展与人工智能技术的进步,大众对人机交互体验的要求也越来越高,这其中就包括使机器能够更了解人类的情绪变化。人脸表情识别作为情绪识别的重要分支之一,也是得到了极高的关注度与研究热情。分数阶傅里叶变换作为经典傅里叶变换的扩展形式,在图像处理与模式识别中也被运用的越来越多。本论文利用分数阶傅里叶变换作为基础工具,在人脸表情识别领域进行了若干研究,总结概括如下:介绍了基于单一阶次分数阶Fourier变换的面部表情识别的系统框架。针对目前研究中常用到的分数阶域的幅度特征与相位特征,分别在图像性质方面以及实验的识别效果两个方面分析了两类特征的优势以及实用性。也验证了,无论是幅度特征还是相位特征,单独一个阶次的信息是无法取得优秀的实验效果的。之前的文献中,研究人员仅仅利用了分数阶的二到三个阶次的特征信息,然后把主要精力用在了寻找最优阶次上。本文认为分数阶傅里叶变换具有无穷个连续阶次,如果可以融合更多的阶次的信息,既可以增加用于分类的特征的判别信息,也可以起到监督效果。根据这个思路,本文作者提出了基于多阶次分数阶傅里叶域统计特征的面部表情识别算法。并在RML数据库与CK+数据库上取得了优于之前基于FrFT特征的识别算法的实验效果。为今后的基于分数阶傅里叶变换的模式识别的研究提供了一个新的思路。Gabor变换由于它自身的一些函数特性,很早就被用在了图像处理与模式识别领域。也是被研究的最多的一种特征提取工具。图片的Gabor特征也是利用度最广泛,保持较强鲁棒性的特征之一。作为两种相似的基于表观特征的面部表情识别特征提取技术,它们都是针对图片的灰度值进行处理运算。本文尝试使用了在判别多重典型相关分空间(DMCCS)下的核熵成分分析(KECA)算法,将表情图像的FrFT特征与Gabor特征融合在一起,并在两个表情数据库中均取得相当不错的效果。改善了的融合技术与两类特征的组合,极大提高了算法的识别率。