基于卷积神经网络的自然场景人脸表情识别研究与实现

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:a139471569
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情蕴含着丰富的情感信息,在人际交往沟通中起非常关键的作用,如何让计算机正确的识别理解人脸表情信息是一项具有重要意义且极具挑战性的工作。随着深度学习的发展,利用深度学习技术实现人脸表情识别成为了表情识别领域新的研究热点。人脸表情特征大多集中在人脸的局部关键区域,如眼睛、眉毛、嘴巴及其周围区域,人们可以忽略人脸的整体信息,而直接借助人脸的局部关键区域信息,来正确的识别人脸图像中的表情类别。因此,如何让深度神经网络对输入的自然场景下的人脸图像中提取出更有区分性的表情特征,从而提升表情识别网络的整体识别精度是表情识别研究的重点。现有的一些人脸表情识别方法中大多通过定位人脸关键点,并裁剪出多个人脸区域,送入网络中然后通过特定的注意力机制等来突出某些对表情分类贡献较大的区域的作用。虽然这能在一定程度上提升识别效果,但同时也会增加网络的计算量,并使网络结构变得更加复杂。自然场景下的人脸图像背景较复杂,往往会受到不同因素的干扰,比如光照变化、遮挡以及头部姿态变化等,实现自然场景下的人脸表情识别更具重要的研究价值和现实意义,因此本文主要针对自然场景下的人脸表情识别算法进行研究以及表情识别系统进行设计与实现。具体来说本文的研究工作如下:首先,本文提出了一种基于破坏重建学习方法的深度卷积神经网络ADC-Net,该网络先通过打乱机制破坏人脸图像的原始空间结构,增加图像的识别难度,迫使网络从打乱的人脸图像中学习到更具区分性的人脸表情特征,从而提升网络的整体表情识别性能。具体来说,首先将输入的人脸图像分割成相同大小的局部子区域,并将这些局部子区域在一定范围内随机打乱重新排序得到新的破坏图像,增大识别难度。然后将原始图像和破坏图像一起送入主干网络进行特征提取,并通过一个通道注意力模块来增强有效特征,抑制无效特征。同时,在重建的过程中,加入区域对齐网络,试图让网络恢复原始图像中局部子区域的原始空间布局,建立局部子区域间的语义关联模型。实验结果表明,本文提出的ADC-Net网络在两个自然场景下的人脸表情数据集RAF-DB和FERPlus都能取得了很好的识别效果,分别达到了88.46%和88.9%的识别准确率。其次,对于本文提出的表情识别网络ADC-Net,本文利用一种称为加权梯度类激活映射的方法,对ADC-Net网络模型作了“可视化解释”的研究,生成对应输入网络中的人脸表情图像的注意力热图,来反映输入图像中对分类结果影响较大的区域,从生成的热力图中可以明显看到ADC-Net关注到了人脸关键局部区域的表情特征,证明网络能从这些局部人脸关键区域中提取到更具区分性的表情特征,并且本文利用选取的RAF-DB数据集中的具有遮挡和人脸姿态问题的图像集测试了ADC-Net对人脸图像中遮挡和姿态问题的鲁棒性能,实验结果表明ADC-Net对此类问题能有较好的鲁棒性。最后,基于本文提出的ADC-Net表情识别网络,搭建一个基于Py Qt的实时人脸表情识别系统,实现三种模式:本地图像、视频和实时摄像头的人脸表情识别功能,进一步验证了本文提出算法有效性和实时性。
其他文献
学位
18世纪的工业革命和运输贸易推动了有组织性的期权交易在美国和欧洲地区的发展.1973年,芝加哥期权交易所的成立标志着期权正式成为了金融行业的一部分,这也是全球第一个规范化的期权交易所.随着金融业的快速扩张,各种金融衍生品受到了投资者的广泛青睐,但是风险也与之并存.期权是进行风险管理和实现风险转移的核心工具.因为投资者的需求多种多样,所以许多新的期权种类应际而生,例如障碍期权,复合期权等.并且由于场
期权是金融衍生品的重要成员之一,在现代金融市场中,它是以期货为基础衍生出的一种新型金融工具,是金融投资者为实现套期保值和风险管控的核心工具.在过去的三四十年里,国内外金融衍生品的快速发展已经成为了金融市场中最为璀璨的进展之一.因此,如何合理的对期权进行定价是当前金融界和学术界的热门研究话题.近些年来,随着金融市场的不断发展,金融市场中衍生出了很多的新型奇异期权.其中,障碍期权其中一种极具代表性的弱
超声波是无损检测的重要手段,也是水下通讯的重要途径。超声波的发射与接收一般应用压电陶瓷换能器(PZT),但PZT由于自身共振特性,只能实现单点检测,检测范围受到很大限制。近年来,随着光纤传感器的迅猛发展,光纤布拉格光栅(FBG)以其抗电磁干扰、耐高温、抗腐蚀、体积小、质量轻、易于复用等优点,应用于各领域。在超声波传感方面,FBG有着更大的频率检测范围,基于这一特性,FBG超声传感器的研究具有较好的
随着人工智能技术的兴盛和互联网的普及,电子商务为企业带来了发展的新契机。目前,人工智能可应用于电子商务的各个方面,例如电子商务领域中的智能客服。但是,现有的智能客服只能根据顾客输入中的关键字简单地回应顾客,无法进行自动谈判。另一方面,当前的电子商务应用每天都会产生大量数据,这些数据在电子商务中是很有价值的。例如,我们可以使用大数据向顾客推荐商品。除此之外,大数据还可以用来帮助买卖双方之间进行谈判,
随着社会的进步,经济的不断发展,20世纪70年代起光纤传感技术得以快速发展,而双马赫-曾德尔(M-Z)干涉光纤传感系统具有结构简单、灵敏度极高、信号处理容易、方便解调、成本低等优点,在周界安防和管道泄漏检测及桥梁大坝、大型设施建设项目等领域得到了广泛的研究和应用。双M-Z光纤传感定位系统利用外界入侵扰动引起干涉信号的相位发生变化,再通过干涉解调成光强度变化,由光电探测器转化为电信号,利用互相关算法
针对平方根容积卡尔曼滤波高斯混合概率假设密度 (Square Root Cubature Kalman Filter Gaussian Mixture Probability Hypothesis Density, SRCKF-GM-PHD)算法在高杂波条件下对非线性目标跟踪能力弱的问题,该文首先融入改进灰狼算法,实时调节过程噪声Q和量测噪声R。其次,结合改进的渐消因子思想,实时调整SRCKF-G
在人工智能界,常识知识获取一直是公认的核心难题。所谓常识,是指日常生活中人与人之间存在的共识。人们的观念不断改变,常识也在不断发展。常识知识在自然语言处理、计算机视觉等领域都有着广泛的应用,但常识具有隐含性、大规模性、无领域性等特性,并且常识的理解机制尚不明确,使得常识知识获取成为限制人工智能发展的瓶颈问题。目前,根据自动化程度可以将常识获取的方法分三类:手工获取能够得到隐式的常识,但耗费大量的人
在互联网以及信息技术飞速发展的今天,物联网(Internet of Things,IoT)的研究得到了广泛的关注和重视,我国已经将物联网列入了国家的五大新兴战略性产业之一.物联网按照特定的网络协议将物体接入互联网,进行数据的交互,使得物物相连.随着人们生活水平的提高,物联网正在被逐渐被应用到家庭之中,例如家庭中的安防系统,灯光控制系统,温度检测系统等,物联网技术在家庭中的应用使得人们生活变得更加安
道路是现代交通的主要组成部分,对于管理和更新地理信息系统数据库中的道路信息非常重要。遥感图像数据已经迅速成为自动提取道路网络的主要数据源,它可以提供高精度的地面信息以及更复杂的背景细节,还可以进行大规模的道路监控,给道路提取带来了很大的改进空间,然而目前视觉判读仍然是更新道路的主要方式,这种方式成本高、需要耗费大量的时间和物力,给自动提取道路任务带来了影响。高分辨率遥感图像中的道路具有较大的类内差