人脸表情识别中几个关键问题的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:liuliumin3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动人脸表情识别(AFER)是近年来发展起来的研究热点,其目的是让计算机等机器辨认出人类特有的情感表现之一——表情。由于人表情的复杂、微妙等特性使得表情识别变得异常的具有挑战与艰巨性,就整个识别系统来说,主要表现在以下几个方面:(1)人脸数据获取的速度与准确率问题;(2)作为识别必要前提条件的面部关键特征精确定位问题;(3)表情特征的提取与识别问题。本文重点探讨了人脸表情识别中的上述关键问题。主要工作总结如下: 1.从情感出发,在简要介绍情绪理论的基础上,全面综述了表情识别的研究历史与现状。讨论了情感计算在国际与国内的研究状况,介绍了情感的基础情绪的基本理论,重点而全面地综述了情绪的表达方式之一——面部表情的识别技术。将人脸表情识别工作划分为两个部分,概括地描述了表情识别的一般模型。根据表情识别的目的、手段将其分为三个阶段,对每个阶段的研究特点以及代表性方法进行了较为详尽的介绍。从面部特征自动定位、人脸表示模型、分类和识别算法三个角度对人脸表情识别领域的主要技术方法进行了分类整理,阐述了人脸表情识别的研究现状。简要介绍了几种主要的人脸表情库,总结了现有的主要人脸表情识别系统的情况。最后,本文讨论了人脸表情识别领域目前仍然面临的主要技术难题和开放问题。 2.研究了基于肤色与模板的人脸检测问题,提出了一种基于肤色与梯度模板的人脸检测算法。人脸检测是人脸研究中的必要研究课题,已经出现了多种经典算法。但是基于肤色的人脸检测研究时间并不长。本文在前人对肤色空间的研究成果基础上,采用了一种新的人脸匹配模板——梯度模板,试图使其包含有尽量多的人脸信息。整个算法达到了肤色空间过滤大部分非肤色区域,人脸梯度模板准确检测的效果。 3.研究了特征精确配准问题,对活动模板模型在搜索空间与搜索过程上做了一些改进。面部特征精确配准是鲁棒实用的人脸表情识别系统的基本前提。主动形状模型(ASM)是目前解决该问题的主流方法。本文详尽地分析主动形状模型(ASM)的工作原理,仔细地讨论了它的优缺点,并在此基础上,提出了三点改进:(1)针对经典ASM算法中模型空间构造的不足,在原模型空间的基础上加入了形状变化子空间,提出了最优搜索空间的概念,提高了原模型空间的模型表达能力(2)针对经典ASM算法及其以后的改进算法中没有任何对搜索结果进行评价的现实,提出了一种合理、简便、易行的评价方法,使搜索过程变得不再盲目,搜索结果更符合实际情况。 (3)在第二步评价的基础上,针对ASM算法搜索过程中模型搜索和图像纹理搜索相互独立的缺点,提出了一种最优搜索算法,其中使用了反馈策略,使得两种空间的搜索结果互相约束,互相利用,搜索过程变得更加合理,智能。这些改进在一定程度上弥补了ASM算法中模型空间与搜索过程的不足,更能够比较精确地定位预定义的面部关键特征。为后续的人脸表情识别打下了良好的配准基础。 4.研究了独立分量特征(IC)人脸表情表示方法,提出了一种AdaICA人脸表情识别新方法。利用独立分量作为特征进行判别分析,不仅是特征之间相互独立,而且还能充分利用变量的高阶统计量信息,具有很强的优势。但是它具有两个方面的缺陷:第一,独立基的获取结果很随机,并不唯一。第二,独立基的判别分析性能不稳定,有的独立基可能具有很强的识别能力,有的则相对较弱。总的来说是获取与选择独立基成为两大难点。针对这个问题,本文考虑了统计性原理,多次运行ICA算法,在此基础上,将Boosting策略创新性地应用于ICA特征的优化与选择,最终得到数目较少、判别分析能力较强的AdaIC特征,并最终通过对AdaIC特征的判别分析实现人脸表情识别——即所谓的AdaICA人脸表情识别新方法。在JAFFE与自选两个人脸表情图像库上的对比实验表明AdaICA方法可以有效提取判别特征,识别精度也比传统方法有了较大提高。 5.研究了基于离散小波与离散余弦的人脸表情全局特征提取与分析方法。简单地研究了全局表情特征的提取问题,采用离散小波对图像进行压缩,利用离散余弦变换对压缩图像进行去相关、聚能运算,并将最终的对角拉直主要能量数据作为待识别特征。算法简单,实现容易。 6.研究了基于局部特征的表情分析方法,提出了一种新的局部二元模式表情识别算法。由于表情是由一些局部肌肉变形组合而来,准确的局部特征在表情识别中应该具有很强的优势。但是以下几点需要注意:第一,采用的算法能够真正地提取局部特征,真正地反映局部的拓扑结构或者是空间信息,而不是将全局特征提取算法用在图像的局部上。第二,提取的特征对局部的变化很敏感,微小的局部变化都应该被反应出来,以保证准确地提取很细微的表情特征。第三,具有一定的组合能力,因为表情是局部形变的组合。基于以上几点考虑,本文引入了在图形学中具有很强描述纹理能力的局部二元模式(LocalBinaryPatterns,LBP)算法,改进了其中的三点对表情识别不利的因素:(1)将原图像经过小波包分解并在其它频率图像为零的情况下重构,得到了四幅与原图像大小相等的不同频率图像,在一定程度上增加了原图像的数据,改进了原算法数据量不足的问题。(2)将图像由粗到精的方式分为好多LBP直方图块,采用级联的策略串联每个块中的LBP直方图,这种提取方式的改进使得最终的特征同时包含有局部和全局的纹理信息,使得在识别的时候性能更鲁棒。(3)通过分析LBP图像的特征,提出了一种合理的定权策略,各种特征的组合一方面符合图像内容本身的信息特征,另一方面达到了一定的自适应要求。利用改进后的算法来进行表情判别分析,实验结果表明:本文的改进确实提高了原算法鲁棒性,增加了面部表情的识别率。
其他文献
输变电设备物联网(Internet of power transmission and transformation equipment,IOTTE)是智能电网由系统智能化向设备智能化的延伸和发展,电网安全运行与设备状态信息具有紧密联系,由于输变电设备种类多,设备信息构成复杂,输变电设备物联网必定是一个在物理空间和信息空间具有强关联性和高度混杂性的网络。输变电设备物联网在信息模型、通信网络等方面存
随着无线通信业务量的迅速增长,无线通信系统在系统容量和覆盖范围方面的要求越来越高。分层覆盖技术被用来增加系统容量、扩展小区覆盖范围。在无线通信系统中,信道是一种非常
超宽带(UWB)技术作为一种极具潜力的高速、短距离、低功耗的无线传输方式,近些年在学术界和工业界都引起了极大的关注。正交频分复用(OFDM,OrthogonalFrequency Division Multi
一、临沂城防洪现状rn临沂城位于山东省东南部,是临沂市政治、经济和文化中心.改革开放以来,临沂城市建设发展很快,目前市区面积已发展到54km2,人口达58万多,为鲁东南交通枢
近年来数字通信技术得到了长足的发展。调制与解调技术是数字通信技术的最基本也是最为关键的技术。常见的调制技术有频移键控(FSK)、相移键控(PSK)、正交幅度调制(QAM)、正
随着无线通信技术的不断进步及相应业务对频谱资源需求量的急剧增加,使得传统的、静态的频谱资源分配方式面临巨大挑战。这种分配方式的频谱资源利用效率很低,成为下一代无线
淮河蚌埠老闸建于1958年,为了扩大淮河中游泄量,提高防洪标准,增强老闸抗御洪水能力,国家投资1.5亿元的新闸于2000年8月开工……
自美国联邦通信委员会发布E-911定位法规以来,蜂窝网络无线定位技术成为近年来的一个研究热点,各种移动定位技术标准和定位算法相继被提出。虽然各种算法已经取得了一定的成
采用第三代移动通信技术的优势在于,网络运营商可以依赖于更高的频带利用率和更高的传输速率,为用户提供丰富的业务。随着移动通信网络与互联网(Internet)之间的业务交互在通
随着社会经济的发展,人们对水资源需求逐步增加与水资源短缺的矛盾日益突出,经济主体多元化的局部利益与水资源的合理开发、综合利用及防洪排涝的整体利益之间的矛盾也日渐增