基于卷积神经网络人脸表情识别的研究

来源 :广西师范大学 | 被引量 : 2次 | 上传用户:jm8888jm8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在表情识别研究中引入卷积神经网络(Convolutional Neural Network,CNN)已经成为近几年的主要技术路线,并且取得了较好的进展与效果,促使面部表情识别(Facial Expression Recognition,FER)逐渐从实验室走向实际应用。虽然现有的深度卷积神经网络在人脸表情识别中取得重要进展,但往往是以增加网络复杂度为代价,这在很大程度上限制了模型的潜在应用,如和谐人机交互等。本文通过对人脸表情识别进行分析与研究,提出了一种基于注意力机制和LSTM的轻量级人脸表情识别网络(lightweight expression network,LENet),实现了人脸表情的快速准确识别。本文主要的研究工作如下:(1)根据人脸表情识别的发展趋势及课题要求,了解相关表情识别网络模型和算法,提出了本文人脸表情识别的总设计方案。(2)对人脸表情学习率进行分析与研究,搭建了ResNet18和ResNet34两种深度神经网络模型用于人脸表情的识别,将SGD、Adam和Adabound优化算法应用到这些网络模型中,并在CK+数据集上采用十折交叉验证方法进行实验。实验结果证明,RestNet34模型在CK+数据集上达到了99.98%的精度。这表明Adabound对表情识别模型学习率调整效果显著。(3)与现有复杂的表情识别网络模型不同,LENet通过设计一个6层卷积神经网络作为基网(Base Net)来提取表情特征,减少了网络参数。并设计了一种基于LSTM的Attention机制,使网络可以聚焦人脸中最具表情鉴别力的区域,提升了人脸表情识别的精度。通过大量的实验分析验证了LENet在1.3M参数量下,在CK+和FER2013两个公开表情数据集上分别取得了99.98%和69.83%的表情平均识别率,尤其显著提高了生气、恐惧和伤心这三类难以区分的表情的识别率,均优于已知经典表情识别算法。
其他文献
以往研究显示,在影响植物生长发育的众多重要环境因子中,昼夜长度的周期性变化是最重要的因素之一。尽管一些昼夜周期响应基因的功能已经被明确,但光周期调控植物生长发育的
2008年世界智力运动会在北京的成功举行,智力运动项目随之在中国蓬勃发展。在智力运动项目中,非完备信息博弈占了很大的比重。广大人民群众对非完备信息博弈智力项目的学习热
NC-OFDM通信系统由于在具备传统OFDM系统抗多径、频谱利用率高的优点的同时,还可以通过感知周围环境的变化,选择不同的子载波发射数据,进一步提高了系统传输的可靠性,因此在
本文研究了两类生态模型概周期解或周期解的存在性,主要利用Mawhin重合度延拓定理来推导多重正概周期解或周期解存在的充分条件.本文研究内容如下:第一章概述了文章所研究问
在自然界中,微生物无处不在。这些微生物尤其是细菌寄生于人体,通过相互作用调节机体平衡,影响人体的新陈代谢。近几年来,有关微生物的研究数据,随着实验条件与技术水平的迅
伴随着网络中信息的爆发增长,与其随之同时产生的还有渐渐增多的视频数据。对这些大量数据信息,若能够实现检索、浏览、存储时的高效,人们就能方便地获取到自己感兴趣的内容
现代啦啦操项目起源于美国,从20世纪80年代开始,啦啦操项目从美国向世界多个国家传播,随着世界啦啦操锦标赛的举办,不仅是全球啦啦队界的一项重要赛事,也代表了啦啦操项目的
载流子迁移率是反映半导体输运性质的一个重要参数,而室温下的电-声子散射是影响热载流子本征输运的主要因素。本论文通过基于密度泛函微扰理论(Density Functional Perturbat
碳纳米卷轴结构是一种由单片石墨烯卷曲而成的结构,与多壁纳米碳管不同,碳纳米卷具有边缘开放的结构特征。在通常的碳纳米管制备过程中,碳纳米卷甚至比纳米碳管有更大的产额,
三维人体曲面建模是计算机图形学和图像处理领域研究的热点之一,在3D服装CAD、虚拟仿真系统和游戏动画领域,3D人体建模是亟需解决的问题。三维人体重建技术是实现3D服装设计