基于深度学习的人脸表情识别算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dvdwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别算法是人脸识别技术中的重要组成部分,广泛应用于人机交互、自动驾驶和安防监控等领域,近年来成为学术界和工业界的研究热点。人脸表情识别算法根据人脸表情特征进行建模,使得模型可以在给定图像或视频中识别出特定的表情,确定对象的心理情绪,从而进行相关处理。现有人脸表情模型难以捕捉面部肌肉的细微运动,且容易受到光照变化、遮挡、非正面头部姿势以及身份信息等因素影响。针对上述问题,本文提出基于Alex Net-Emotion的静态人脸表情识别算法和基于注意力机制的动态人脸表情识别算法,经实验验证在静态和动态人脸表情识别场景中均实现了高精确度和鲁棒性。本文研究内容和创新点总结如下:(1)针对目前静态表情识别存在难以精确提取表情特征的问题,提出基于Alex Net-Emotion的静态人脸表情识别算法。本文通过使用更小的卷积核改进Alex Net网络,以减少模型参数和有效检测面部肌肉的细微运动;同时,针对训练数据集小容易造成模型过拟合的问题,增加了批量归一化层和使用PRe LU非线性激活函数,加速模型收敛和缓解过拟合现象。另外,针对模型提取表情特征的鉴别能力不强的问题,提出将人脸关键点角度变化特征作为辅助信息,使得模型保持身份不变性,增强表情特征的表达能力。(2)针对只使用Softmax损失函数训练模型导致的较小类间方差和较大类内方差问题,提出Softmax损失和改进的Island损失联合优化方法,两个任务损失函数在训练网络时,发挥各自的优点,使得簇内样本尽量紧凑,簇间尽量远离,提高模型的辨别能力。针对Island损失在计算样本与对应类中心的间距时,不能有效区分容易样本和困难样本的问题,本文使用在线困难样本挖掘技术,只计算超过类中心点半径?的样本,让模型关注比较难分类的样本,从而加快模型收敛速度和提高分类能力。(3)针对静态表情识别算法难以有效在动态场景准确识别人物表情,本文在Alex Net-Emotion网络基础上,提出基于注意力机制的动态人脸表情识别算法。该算法包含三个模块:特征嵌入模块、循环神经网络和注意力模块。特征嵌入模块由Alex Net-Emotion网络组成,用于精确提取每帧的表情特征。循环神经网络模块对时序数据进行建模,使得模型可以有效利用当前帧的上下文信息,生成每帧的隐藏层状态特征表示。为了区分不同表情强度视频帧的重要程度,引入注意力模块计算每个时刻隐藏层状态特征的权重,通过线性加权,生成视频级表情特征向量,有效解决了动态场景下难以有效整合视频帧表情特征的问题。
其他文献
如何在存储系统上安全可靠的保存数据,是当前数据存储网络的重要挑战之一。具有高扩展性和良好计算能力的分布式存储系统逐渐得到重视,其根据实现目标和部署环境大致可分为两类—P2P存储系统和数据中心存储系统。它们具有运行和并行运算的优势,可解决大规模应用问题。本文将数据存储网络结构分为传统存储系统和分布式存储系统进行介绍,考虑到分布式存储系统良好的扩展性和数据抗毁性,重点介绍其两个具体实现形式:P2P网络
超宽带技术是改善设备间通信,跟踪和监测病人的一种很有前景的解决方案。在未来,这项技术能够以新的能力来扩展多媒体互联网世界,并集成更多的设备。多媒体物联网推动了医疗应用领域的创新型产品开发。其需要对延迟敏感的高带宽设备。目前,由于中枢神经系统不同区域的损伤,一些人面临着不同类型的生理问题。因此,他们失去了平衡协调能力,其中一种协调问题是病人无法控制自己的身体运动。所以这种协调性障碍需要看护人拥有一个
川藏铁路的建设是全国乃至全世界人民所关注的重大工程,川藏铁路途经我国众多水源地与生态敏感区,国家高度重视川藏铁路线路沿线生态环境保护。川藏铁路施工过程将不可避免产生各类柴油、机油等的泄露,油类会逐渐渗透至土壤深层,危及周边生物的生存,影响地球生态系统物质交换,最终将影响整个地球的生态平衡。为此,本文针对施工过程中的油污染土问题,综合考虑混凝土结构的高可靠度要求,拟采用水泥砂浆对油污染土进行固化处置
休闲渔业作为当代渔业的重要构成部分,对于渔业经济的贡献较大,是渔业经济结构调节的重要环节。自“十二五”以来,我国休闲渔业持续快速发展,逐步成为我国渔业经济的一个新的
逆热传导问题在实际工程领域有非常重要的应用,全文讨论了两类逆热传导问题的数值算法。通过相关的理论分析,我们用直接求解法和Gradient型迭代法进行数值模拟,数值结果验证了所提出方法的可行性与有效性。全文主要分为以下四个章节:第一章是绪论部分,主要简述了偏微分方程反问题的一些研究背景和国内外研究现状,尤其是对抛物型方程系数反问题的研究做了详细的介绍。第二章主要研究一类利用内部温度数据重构热通量的反
随着经济体制改革的不断推进和社会结构调整的不断深化,“社区制”已经成为了我国当前城市基层社会的主要管理体制,越来越多涉及居民生活的公共服务逐渐由社区承接。而社区居民不断提高的民主意识,更多复杂化、多样化的服务需求,越发强烈的自我发展诉求的表达意愿都在要求着传统社区治理模式的转型和升级。参与式治理作为一种新的社区治理模式,以赋权为关键,以民主协商为手段,以自主治理为基础,让政府、社会组织和社区居民等
分子电子学是基于分子尺度,通过构筑微尺度电极和单个分子或者少量分子聚集体的“电极-分子-电极”分子结器件,研究跨越分子的电荷输运性质。它将分子本征化学特性与器件构筑相结合,考察分子的理化特性与电荷输运的构效关系,揭示微尺度的量子输运动力学原理,并探索基于分子体系的功能电子器件性能。是一个集化学、物理学与微电子学为一体的交叉学科。近年来,分子电子学作为一个前沿的交叉学科,受到了越来越多的科学工作者关
并行程序近些年来的兴起在提升性能的同时,也给程序的编写,开发和维护提出了新的问题,多线程程序在执行过程中,线程之间围绕共享资源广泛存在着数据,同步操作之间的竞争和相
“被”字句一直是对外汉语教学内容中的重难点,在进行汉语作为第二语言的学习过程中,巴基斯坦学习者出现了各种“被”字句偏误问题,影响其信心甚至影响自身进一步提高汉语水平,这对在该国对外汉语教学活动的有效进行是十分不利的。近年来,来华巴基斯坦留学生的数量也在逐年增长,学习汉语的巴基斯坦学生与日俱增,解决他们的汉语学习问题也就成为对外汉语教学事业向前迈进中必不可少的一步,也具有现实意义。本文以第二语言习得
本论文主要对压力传感器的测量结构和软、硬件设计展开研究,在参考前人的经典设计和理论的基础上,参考多种力测量方式,制定了电容测量方案,设计了一种基于MEMS技术的差分式结