基于深度注意力网络的人脸表情识别

来源 :西南大学 | 被引量 : 0次 | 上传用户:mzybbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情作为一种传递情绪状态和意图的非语言信号,在人际交流、人机交互、安全驾驶和在线教育等领域发挥着不可磨灭的作用。高效准确地识别人脸表情是一项充满挑战且意义非凡的任务。近些年已有诸多国内外学者和科研机构对其进行深入的研究,人脸表情识别也成为计算机视觉领域的热门课题。人脸表情识别是指计算机模拟人的思维和认知方式将提取的人脸表情特征进行分类,进而分析和理解人的情感状态。当前的人脸表情识别算法一般分为基于静态图片的人脸表情识别和基于动态视频序列的人脸表情识别,本文主要侧重于静态图片中的人脸表情识别。深度学习作为机器学习的一个分支,相较于传统机器学习算法需要人工设计和提取特征,深度学习能够以监督或非监督的形式自适应地学习多层次的判别性和鲁棒性较好的描述子。近年来它在目标检测、图像分类、图像检索、语义分割等计算机视觉任务中成绩斐然,各种性能优良的深度学习模型层出不穷。凭借卓越的表现深度学习征服了众多研究人员,成为人工智能领域热门的研究方法。本文利用深度学习技术开展对静态图片中人脸表情识别的相关研究。对深度学习理论和当前备受关注且性能优良的深度学习模型进行了充分研究和持续总结之后,本文对现有的模型进行了改进。在继承传统模型的诸多优点的基础上,融合注意力机制提升模型的鲁棒性和准确性。本文的主要工作分为以下几个部分1、为了尽量减少卷积神经网络池化层丢失部分信息的影响,本文提出一种轻量化的多尺度注意力卷积神经网络。该模型能够融合多个尺度卷积操作学习到的视觉特征,这些特征能够有效地传递到高层,使更高层可以同时整合和抽象不同尺度的特征。通过深度学习层次化连接的特性学习高度抽象化的语义特征,利用可判别性和鲁棒性较高的语义特征提升人脸表情识别的准确性。2、由于人脸不同区域的视觉信息对于人脸表情识别的作用各不相同,而传统的深度学习方法忽视了该问题,无差别地对待整个人脸区域,从整张人脸图像中提取固定维度的全局特征。为了有效利用人脸的局部特征,本文提出多通道卷积神经网络,该网络能够自适应地从完整的人脸表情图像和人脸部件(Facial Components)(例如:眼睛、嘴巴、鼻子等)图片中学习判别性优良的全局特征和局部特征。3、为了避免冗余信息和噪声信息对表情识别的影响,本文将注意力机制融入到深度卷积神经网络中,通过模型的迭代优化自适应地捕获不同人脸表情所涉及的不同显著性区域。这些显著性区域所包含的视觉信息能够被赋予不同的权重,从而有效的整合成判别性和鲁棒性较好的深度特征。4、当前的深度学习模型中一般采用SoftMax分类损失作为监督信号(Supervision Signal)来训练模型和优化参数,而SoftMax分类损失无法满足同时增大类内相似度和减小类间相似度的要求,本文通过设计新的损失函数-Regularized Center Loss、Improved Triplet Loss-和SoftMax分类损失联合使用作为模型训练的目标函数,使得类内聚合、类间分散,极大地提升了深度卷积神经网络学习到的特征的可判别性,从而较大幅度提升表情识别的效果。为了验证所提出的方法的有效性,本文在CK+和Oulu-CASIA等人脸表情数据库上进行对比实验,实验表明本文所提出的方法能显著提高人脸表情识别的准确度。
其他文献
在市场经济快速发展的今天,全面预算管理作为一种现代化管理机制,已经在众多的大型集团公司得到了广泛的应用。SQ公司是以天然气长输管网建设运营为核心,集下游分销业务于一
本文通过内蒙古中部地区土默川灌区和武川旱作区2年、3个马铃薯品种、7种施肥处理的田间试验,对其块茎产量、品质(淀粉、粗蛋白质、矿物质)形成和千公斤产量氮、磷、钾吸收量及
德国现代建筑是世界建筑研究中的一个重要组成部分,它在世界建筑史研究上占有极其重要的一页。本论文试图以即时史学研究的视角,从德国近百年以来建筑发展中的典型建筑展览事件
在国内外资本市场经历过数次财务舞弊的风雨洗礼后的信息繁杂时代,会计师事务所作为财务信息需求者与提供者之间的沟通纽带,需要就其所承接的审计业务形成审计报告,而市场参
目的 探讨超关节外固定架治疗大关节骨折。方法 对四个部位的 19例大关节骨折 ,进行超关节固定适度轴向延长和有限内固定进行观察分析。结果 关节骨折愈合优良率 89 5 % (
大量研究表明,地下水与斜坡稳定性之间存在着较大的联系,地下水浸湿松散岩土体,会显著降低其抗剪强度,致使边坡稳定性降低,当地下水位到达一个临界值时,就会演变为滑坡。本文
城市垃圾发电项目主厂房一般有若干个结构单元组成。通常采用多层钢筋混凝土框排架结构和大跨度钢结构,以及两者混合的联合厂房,框排架结构刚度差异大。文章介绍了地震作用时的
分析了宁夏设施农业发展现状及存在的问题,并从完善基础设施、推进标准化生产、调整结构、开拓市场、延长产业链条、加强技术培训等方面对宁夏设施农业的发展提出建议。
短时交通流预测是交通控制和诱导系统实现的前提,高精度的短时交通流预测对良性交通导航、城市道路使用效率的提高、交通拥堵的缓解有着重要意义,因此,智能交通控制与诱导要
采用问卷调查的方法,调查浙江省金华市、绍兴市和台州市四所高中高一、高二年级416名学生的化学实验情感态度与价值观,结果表明:学生的化学实验情感态度和价值观是积极的、令