人脸表情识别系统中的分类方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:svsehwx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对人脸表情识别系统中的分类模块进行了研究。实现了基于静态图像和视频序列场景中的人脸表情识别算法。通过对特征数据的处理分析,训练得出每个人脸肌肉运动单元(Action Unit,AU)的分类器,根据运动单元的分析结果,结合表情事件集的预定义,最终得出表情分类结果。该系统将运动单元的分类和解释模块分开,使得其应用范围更为广泛,对于场景的变化要求能够灵活便捷的满足。   本文首先介绍了人脸表情识别系统的应用背景和研究现状。接着介绍了几种常见的分类方法并指出了各自的优缺点,从统计学习理论的角度引出了本文运动单元分类模块所选用的分类算法——支持向量机(Support Vector Machine,SVM)算法。结合SVM算法的理论介绍,详细阐述了该算法在AU分类模块中的相关应用。通过对数据进行相关性分析,利用主成分分析算法进行数据降维,从而减轻计算压力。同时,数据的归一化处理消除了奇异样本对分类结果的不利影响。SVM分类器的核函数选择部分,我们给出了传统的径向基核函数以及线性核函数结合径向基核函数两种不同的核函数选择方式所对应的F1分数,后者在时间性能上具有较大的优势。最后,我们给出了AU到表情事件集的映射关系,结合概率模型,构成AU解释模块。经过系统综合测试,AU的识别率能够达到目前该领域较好的水平,我们将测试结果与FERA(Facial ExpressionRecognition and Analysis)大赛提供的参考方案的结果进行了比较分析,从平均意义上看,无论是在精确度、F1分数还是在ROC(Receiver Operating Characteristic)曲线面积等衡量准则下,我们的系统都具有较好的性能。
其他文献
认知无线电技术是无线电技术发展的一个里程碑,它的出现给无线通信带来了革命性的变化。认知无线电是一种智能的频谱共享技术,从用户通过频谱感知伺机占用主用户遗留的空闲频
自组织网络(Self-optimizing network SON)是LTE-A系统的关键技术之一。SON可以降低人工干预,减少运营费用并提高网络性能,其流程主要包括测量、自配置、自优化和自修复。本文主
在物质资源日益丰富的今天,娱乐活动越来越受到人们的追捧,而音乐是娱乐活动中最不可或缺的一项。通过音乐,人们可以在情感上获得一些共鸣,交到知心朋友,可以发泄或是分享情绪,可以
人脸作为重要的生物特征,逐渐成为计算机视觉领域里最为活跃的研究方向之一,三维人脸模型因其包含了更多的信息,为处理人脸信息提供了更加有效的手段。三维人脸重建按照获得深度
LTE-A(Long Term Evolution-Advanced)是3GPP组织为满足下一代无线通信技术4G而提出的LTE增强方案,它满足ITU-R对IMT-Advanced(International MobileTelecom)的技术需求。MIMO
随着煤层气、页岩气等非常规能源勘探开发的不断深入,地震勘探对数据的规则性和完整性提出了更高要求。然而由于障碍物、禁采区、采集成本等因素的影响,导致地震数据不完整、
采用数字波束形成技术的多通道雷达,具有传统相控阵雷达无可比拟的优越性,正成为未来的相控阵雷达的一个重要发展方向。本课题主要根据数字化多通道雷达信号处理的需要,完成多通
为了能够提供更高的传输速率和频谱效率,LTE和LTE-A系统均使用正交频分复用技术(OFDM)和频率复用因子为1的组网方式,这种组网方式将会导致相邻小区间存在很强的干扰。如果不采
随着水声定位技术在国内外的迅速发展,水声应答器技术也由早期单一的应答功能,向着使用便捷化、设备集成化、功能多样化的方向快速发展。本文以长基线定位系统为背景,研究具有测
受自身内部结构和外部形状的影响,体目标回波在近场中会携带目标本身的结构和形状信息,表现出不同于点源目标回波的特性。相应地,其回波经过阵列处理后得到的波束形状中必然也含