基于深度卷积网络的人脸表情特征学习方法

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:wfzhousd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感是人类对外在事物的主观感受,面部表情是传递人类内心情感的一种有效的方式。若能准确地识别出人脸的表情并分析其内心情感状态,将能更好地改善人与机器之间的交互关系。因此,人脸表情识别有着很广阔的应用前景,吸引了大量的研究者对其展开研究。本文基于深度学习分别针对静态的人脸图片和动态的人脸序列提出了两种特征学习方法来提高表情识别准确率。针对静态的人脸图片,本文提出了一种基于关键点深度特征的人脸表情识别方法。基于人脸表情识别任务和人脸关键点定位任务之间的关联性,提出引入表征人脸各部件形状的关键点信息来提高表情的识别率。具体来说,设计了一个多任务的卷积神经网络,在识别表情类别的同时定位关键点的位置,使得模型在优化过程中自发探索两个任务的内在关联,使得学习到的特征能更加关注五官周围的纹理信息。进一步利用网络检测到的关键点生成位置注意力图,来调整各个区域特征的权重,增大五官周围特征对决策结果的作用,同时抑制人脸边缘区域的影响。在三个公开数据集Oulu-CASIA、CK+和MMI上的实验结果证明了所提方法的有效性。针对动态的人脸图像序列,本文提出了一种相空间驱动的时空特征提取方法来辅助动态的人脸表情识别。通过观察发现,动态表情的空间纹理和时序信息是互相关联的,因此,空间和时间特征不应该被分别地提取。其次,如何有效地从不同时刻的表情图片中提取能反映表情逐渐变化的时序信息对动态表情识别至关重要。基于上述分析,本文利用三维卷积神经网络(C3D)同步地提取空间和短时特征,每一帧的时空特征为相空间中的观测值。同时设计了一种新的相空间重构方法(PSR)重构C3D提取的观测值,使得重构后的观测值能够有效地表示表情动态变化的过程,重构后的观测值中包含了丰富的时空信息有利于识别动态表情。在三个公开数据集Oulu-CASIA、CK+和MMI上的实验证明该方法的有效性,可视化的实验结果还证明该方法关注到的人脸区域具有全局一致性,并且模型提取到了动态表情逐渐变化的过程。
其他文献
《人民日报》是党的机关报,社论作为机关报园地,始终与党中央保持高度一致,积极宣传党的最新理论政策,对马克思主义大众化不断进行诠释。1989-2002年,马克思主义中国化面临新
中文分词是中文自然语言处理中最重要的一步,分词结果的好坏会严重影响后续任务的性能。目前的研究工作中多是使用深度学习方法来进行中文分词。这些研究工作大多数只用到句子中局部的上下文信息。近年来,将中文分词当作机器翻译问题来解决的新思路受到较多关注。基于这种思路的中文分词方法利用机器翻译模型直接对整个语句进行处理,能有效的利用全局的上下文信息。然而,机器翻译模型在翻译的过程中产生的错误翻译会导致分词的准
共振电子复合过程,是指一个自由电子被靶态离子共振俘获形成复合离子的共振激发态,随后通过辐射衰变放出光子的过程。共振电子复合是高温等离子体中的重要动力学过程,影响着
单图像超分辨率重建由于其在恢复图像细节和纹理方面具有很高的现实价值,所以一直是计算机视觉和图像处理领域的研究热点。深度神经网络能够学习低分辨率图像到高分辨率图像
离群点检测能够挖掘出大量数据中包含有价值信息的少量数据,在实际生活中有着广泛的应用,因此离群点检测成为了数据挖掘中的热点问题。离群点检测的主要任务是检测出异常的数据,从而在这些异常数据中获得有价值的信息。基于密度的离群点检测和基于聚类的离群点检测是目前研究的热点问题。本文深入分析了离群点检测的相关方法,针对基于密度和基于聚类的离群点检测中存在的一些挖掘性能不佳的问题提出了改进策略,旨在提高离群点的
伴随着《纺织工业“十三五”发展规划》的发布,中国的纺织行业正逐步迈向工业4.0时代。与互联网、大数据等技术的深度融合,各式各样的数字化智能纺织产品层出不穷,与此同时,
近年来,公共安全问题越发引起人们的关注。为了更好的解决城市安全问题,在人口密集的地方如商场、学校、电影院、游乐场、各大热门景点等地安装了大量的监控摄像头,这些摄像头汇聚在一起,形成一个巨大的监控网络,每天都会产生海量视频数据。但是处理这些海量视频信息大都采用传统的人工方式,通过人眼“盯屏幕”的方式从海量视频中寻找特定的几个监控信息,这样不仅费时费力、效率低下,而且容易遗漏重要信息,若有紧急情况发生
数字图像在人们生活中扮演着重要的角色。边缘则是数字图像中前景与背景的分界处,是图像的一个重要特征。边缘检测一直是计算机视觉、图像处理等诸多领域中的基础且重要的研究课题。在诸多边缘检测算法中,Canny边缘检测方法是目前理论上相对最完善的一种边缘检测方法。不过Canny算法在滤波去噪、梯度计算、边缘连接时的双阈值选择这几个步骤上都存在着缺陷,算法的自适应性较低。对于Canny算法中高斯滤波的缺陷,可
以牛顿法为代表的二阶优化算法已经被应用于解决稀疏学习问题并取得了良好的效果。这种算法与一阶优化算法相比主要的缺点是需要计算海森矩阵而会消耗大量资源,解决上述问题
本论文基于贝克斯快乐护理管理咨询公司在荷兰卫生,福利和体育部以及广东省卫生和计划生育委员会组织的中荷医疗创新研讨会上的商务配对口译任务。旨在讨论口译员在商务配对口译中的作用。本报告的目的是提高联络口译技巧,并为其他口译员提供参考。本报告由五部分组成:任务描述,过程描述,理论框架,案例分析和结论。任务描述主要介绍了口译,委托方和联络口译的特点。过程描述,从三个方面介绍了整个解释过程:前期准备,口译工