论文部分内容阅读
人脸表情是人类在传达情感状态和意图时最有力、最自然的表达方式之一,在人类社会生活中起着至关重要的作用。近年来,随着互联网和计算机技术的迅猛发展,人脸表情识别的研究已经成为人工智能和情感计算等领域重点关注的研究课题之一。迄今为止,在众多研究人员的共同努力下,表情识别的研究取得了很大的进展,不仅极大地促进了心理学、神经科学等科学研究的发展,而且在人工智能、疲劳驾驶、智慧教室、人机交互和刑侦测谎等诸多领域中具有广泛广阔的应用前景。本文围绕着表情识别中的一个颇具挑战性的问题——跨领域表情识别问题,包括跨领域面部表情识别和跨领域面部微表情识别问题,分别基于线性回归模型和字典学习模型,提出了有效的跨领域表情建模与识别方法,并在此基础上进行对所提出的线性识别方法进行非线性拓展,同时采用多个表情数据库进行实验验证。论文的主要研究内容和创新性成果包括以下四个方面:1、提出了一种基于稀疏直推式迁移线性回归模型(STTLR)来处理跨领域的表情识别任务的方法。该方法的基本思想是借助直推式迁移学习模型来消除源域和目标域样本之间的分布差异。为了更好的达到消除分布差异这一目的,该方法从目标域中借助部分无标签的样本作为辅助集,与源域中有标签的样本合并共同作为新的训练样本集参与到回归参数矩阵的学习中。通过辅助集可以使训练好的回归参数矩阵能够更好地融合源域样本和目标域样本的特征信息,具有更加强大的判别力,从而更好地完成领域自适应的表情识别任务。另外,考虑到手工特征包含了局部结构信息的特点,进一步对回归参数矩阵采取组稀疏策略,以获取有效的区域信息同时去除冗余无效的区域信息并减少过拟合。2、提出了一种直推式深度迁移学习网络(TDTLN)的跨领域表情识别方法。TDTLN网络模型借助了深度学习的强大非线性表征力,同时借用STTLR方法中辅助集的思想,将源域数据和部分目标域数据共同作为训练样本来联合学习最优的非线性判别特征,从而改进目标域样本的标签预测值。其中,辅助集的样本标签作为网络参数的一部分被优化,使得源域的交叉熵函数和目标域的回归函数能被同时计算,从而尽可能地缩小不同数据库的样本之间存在的分布差异,且有利于网络参数学到更具有判别力的高层语义信息,从而更好地完成分类任务。3、提出了一种基于字典学习的领域自适应方法(UDADL)来处理跨领域表情识别问题。该模型作为一个线性方法从源域和目标域中捕捉两个领域的共同特征信息的角度出发去训练一个有效的判别字典,并用于对源域和目标域数据特征进行表征。为了使这两个新的特征表示的边缘分布能够彼此更加接近,UDADL方法还引入了两个线性投影矩阵,分别对由字典优化得到的编码参数进行线性投影,以使源域和目标域的编码参数之间具有更加接近的边缘分布。此外,由于模型的部分参数没有闭式解,UDADL模型进一步引入共享字典和分析字典共同构成一个字典对学习框架,对相关的变量进行松弛,从而使模型变得可解。4、提出了一种基于核映射字典学习的领域自适应方法(KDLDA)。该方法借助核映射的思想将UDADL方法从线性领域扩展到非线性领域,即将源域和目标域的表情样本通过核映射的非线性变换将这些表情样本的描述子特征从低维的输入空间映射到一个更高维的特征空间,然后在这个新的特征空间中求得最优的线性分界面,使之前线性不可分的特征在这个高维空间变为线性可分的。