基于深度学习的动态人脸表情识别研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jsyzcqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人类社会的发展过程中,社会交际一直是比较重要的一部分,人脸表情能够表达人内心的情感状态信息,对社会人际关系有重要意义。因此,人脸表情识别研究具有很强的实用意义,动态人脸表情识别应用广泛,例如人机交互、情感挖掘、疲劳驾驶检测等领域。本文研究了大量国内外关于人脸表情识别的研究文献,发现现有的人脸表情识别主要有两类方法:传统的机器学习方法和基于深度学习的方法。传统的机器学习方法分为四个步骤:图像预处理、人脸对齐、人脸特征提取以及表情分类。其中,人脸特征提取最为关键。传统的机器学习方法中图像的特征提取最为关键,本文分析了经典的ASM、LDP和SIFT变换等特征提取算法,以及经典的表情分类算法SVM等。虽然基于机器学习的方法大部分都比较成熟,但是在处理动态表情识别问题时,由于只考虑提取图像的空间特征而忽略图像的时间特征,因此依然存在准确率低、泛化能力差、特征工程复杂的问题。相较而言,基于深度学习的方法在上述问题上表现不突出,并且识别效果更好。为了解决动态人脸表情识别领域中时间特征和空间特征提取和融合的问题,本文提出了一种三维深度卷积残差动态时序神经网络来识别动态人脸表情。该神经网络由Stem层、3 D Inception-ResNets结构、GRU层、Dropout层、Island层和Softmax层等构成,能捕捉人脸表情图像中的空间关系和不同人脸帧之间的时序关系。在本文提出的动态人脸表情识别模型中采用了传统的灰度变换、几何变换等图像预处理技术和人脸对齐算法,并且效果良好;同时为了增加重要的人脸组件在表情识别中的贡献度,除了输入人脸表情帧数据之外,还提取人脸表情的重要特征点信息输入到网络结构之中;网络引入了新的Island损失函数,这种损失函数具有较强的区分不同特征的能力,其不仅能减少相同类别样本类内的差距,还能够增加不同类别样本类间的差距,可以更好地忽略面部表情多变性和敏感性等的影响,获得较高的准确度、识别效率和泛化能力。论文在3个公开数据集CK+、AFEW、MMI上采用独立评测和综合评测的方法进行了实验,本文提出的网络在准确度和识别效率上优于目前主流的动态表情识别方法。
其他文献
品牌资产从上世纪八十年代起日益成为市场营销领域的热点话题。这一概念如今作为企业重要的无形资产,已经成为衡量品牌力量的有效工具。管理品牌资产不仅在于提升品牌形象,更是深化品牌与消费者的关系,从而帮助品牌提高市场竞争力,实现可持续发展。在上述背景下,本论文以惠氏营养品的品牌资产为研究对象,深入分析了惠氏营养品在华品牌资产管理过程中的成功与不足,并提出具体的品牌资产提升策略,为企业和顾客创造价值。惠氏营
“量”对于人类生活并不陌生,它是人们认识生活,描述生活的一种客观方式,人类语言可以通过多种体现手段让“量”得以表达出来。“量”还是一个比较笼统的概念,它可以细分到很多不同的领域,就像事物数量的量,时间长短的量,运动变化的量,这些都下辖于“量”的范畴。李宇明先生根据目前已有的认识将“量”分为了物量、时间量、空间量、动作量、级次量和语势。物量就是人们常说的对物体数量的一种计量,即事物数量上的量,主要可
作为轻质金属材料,镁合金拥有优异的物理和化学性能,其低的密度、高强度及良好的生物降解性,在汽车工业、轻型设备、电子产品、生物医学等领域得到广泛应用。然而,镁合金普遍存在的耐腐蚀性差问题,使其应用受到限制。目前,镁合金耐蚀性的改善途径除提高合金纯度和热处理外,表面改性也是一种有效的方法。常用的镁合金表面处理方法包括化学镀、化学转化、离子注入、阳极氧化、微弧氧化(MAO)、气相沉积等。其中MAO涂层在
南四湖作为南水北调东线输水工程中最大的调蓄湖库和京杭大运河的重要航段,对我国的南水北调工程的水安全及区域社会经济发展和生态文明建设均具有重要的战略意义。然而,随着
异育银鲫(Carassius auratus gibelio)因具有个头大、生长快、肉质鲜美、营养丰富等优点而受到人民群众的喜爱,其产量持续增长,带来了巨大的经济效益和社会效益。然而,大规模
1980年代以来,学界对麦克卢汉的关注度越来越高,尤其他的媒介理论在中国学界引起一时轰动,在国内研究者的共同努力下,日渐揭开麦克卢汉媒介理论的神秘面纱,发现它在国内传播学界和文学领域的研究成果颇为丰厚,也催生了许多新的理论研究点,至今关于麦克卢汉的媒介理论仍有极大的发展空间。但在现有的研究中,大多数都忽略了“媒介即讯息”理论在中国文学理论语境中的发展问题,同时缺乏梳理“媒介即讯息”理论在国内的发展
2014年以来,随着市场监管政策不断调整优化,资本市场整体并购金额、数量以及重组规模迅速扩大,然而一些新情况、新问题也随之成为了监管机构、市场研究者以及投资者高度关注的焦点,特别是对轻资产行业企业的并购,以“高估值、高业绩承诺、高商誉”为代表的“三高”现象突出,且出现了业绩承诺完成率低、承诺期过后业绩开始出现大幅下滑、频繁出现大额商誉减值的情况,甚至有些公司通过各种方式更改承诺以谋求逃避责任,远远
随着深度神经网络的发展,有监督深度学习在有大量标记数据的领域已经可以取得不错的效果。但实际上很多领域只有大量未标记的数据,对大量数据进行人工标注不仅耗时耗力、成本
目的应用DSCT对左心房及肺静脉解剖进行评价,并探讨其在房颤射频消融术中的应用价值。材料和方法40例房颤拟行射频消融术患者及40例进行冠状动脉体检的正常人(经证实无心脏疾
随着改革开放进程的不断深入,工业自动化、智能化的快速普及,智能畜禽养殖也得到了很大发展,规模化的养猪场已经逐渐成为主流。音频监测是规模化养殖的常见技术,当生猪患流行性感冒或细菌感染类疾病时,会发出咳嗽声;当生猪患伪狂犬病或受到挤压时,会发出惊骇声。通过对生猪异常声音的监测,可尽早发现患病或受到威胁等异常情况的生猪,以便及时对其进行处理,减小损失。为了及时发现并定位发出异常声音的生猪,本论文提出一种