基于深度学习的人脸表情识别

来源 :长安大学 | 被引量 : 0次 | 上传用户:a7762350
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在生物特征识别技术的推动下,人脸表情识别逐渐成为一个研究的热点。人脸表情识别可用于人机交互、安全驾驶、辅助医疗和在线教育等应用场景。表情识别的方法包含两个核心的步骤:表情的特征提取和分类。目前,深度学习的方法将这两个步骤合并,自动地学习表情相关的特征并分类,取得了显著的识别效果。由于人脸表情的数据集较少,大多数表情识别网络结构设计简单且通常以静态的表情图像作为研究对象,忽略了表情的动态特性。而表情的序列图像可以提供丰富的与表情变化有关的纹理信息和运动信息,具有重大的研究价值。现有的表情识别方法从研究对象的角度可以分为两类:基于静态图像和基于视频序列的方法。针对静态图像表情识别,本文提出了一种基于Inception结构的深层卷积神经网络结构。与传统的采用手工设计特征的方法相比,该方法利用深度卷积神经网络提取人脸表情的关键特征,更加地合理和有效。此外,针对人脸表情训练样本较少的问题,本文对网络采用了多次微调的训练方法,防止网络出现过拟合的现象。针对视频序列的表情识别,本文提出了一种卷积神经网络和循环神经网络的融合模型。该网络模型主要包含三个部分:空间特征提取网络,时序信息提取网络和双向长短期记忆网络(BiLSTM)。给定一个表情图像序列,空间特征提取网络从每个视频帧中提取表情的空间特征。同时,时序信息提取网络以一对连续帧作为输入提取表情的短期时序特征。最后,将两个卷积神经网络所提取的特征融合作为BiLSTM网络的输入,得到人脸整体形态在时间序列上的变化信息,从而进行表情识别。同时,该网络模型是一个端到端的学习网络,两种表情特征可以相互补充实现较好的分类效果。本文在CK+和Oulu-CASIA数据集上验证针对静态图像的表情识别的方法。实验结果显示,本文所提出的深度卷积神经网络和训练方法可以提高识别的准确率。针对视频序列的表情识别,本文在CK+、Oulu-CASIA和MMI数据集上进行实验。实验结果表明,融合的网络模型可以有效地提取表情的空间特征和时序信息,提高了表情识别的准确率。
其他文献
随着我国教育体制的变革和发展,当前高职院校专业学生的简笔画教学也越来越重要。因此高职院校的教师应该结合学生的专业学习情况,运用一些有效的教学手段,进行简笔画课程的
以浙江红山茶(Camellia chekiangoleosa)的花粉为材料,采用花粉离体培养法,研究不同浓度蔗糖、硼酸所组成的液体培养基对浙江红山茶花粉萌发的影响,筛选出花粉最适离体培养基,
从形态、生理生化和分子水平综述了红树植物的耐盐机理。红树植物具有盐腺、叶片肉质化等形态特征,通过离子选择性积累、盐分区域化、泌盐和拒盐等机制降低体内的盐分浓度,积累
鼻腔填塞术是耳鼻咽喉科常用的治疗方法,传统的双侧鼻腔填塞,常使患者感到鼻腔及头部胀痛不适、溢泪、张口呼吸、吞咽不便、睡眠差,甚至耳鸣、耳闷、听力下降.为寻找一种痛苦
<正>据行业报刊介绍,全球著名的卡博特公司近日推出了两款全新炭黑产品:PROPEL E7炭黑能够降低轮胎滚动阻力,提升车辆燃油的经济性,该产品主要用于高速公路上行驶的长途卡车
期刊
目的:探讨急性心肌梗死(AMI)合并少量心包积液诱发心脏压塞的发病机制和临床特征。方法:分析1例病例并复习文献。结果:心包压塞是心包积液累积、心包腔压力增加共同作用的结
大陆下地壳麻粒岩的流变学研究可以解释地壳变形、壳幔物质交换以及岩石圈深部动力学过程等科学问题。前人通过研究各矿物的显微构造变形特征与变形机制,运用广义混合流变律
《全日制义务教育品德与社会课程标准(实验稿)》中历史被纳入德育过程,要求在小学品德课程中,学生通过对历史的了解,形成良好的品德。阐述了小学品德课程中历史题材教学的途
竞技健美操(Sport aerobics)是融体操、舞蹈、音乐为一体的带有表演艺术的体育项目。我国的竞技健美操项目虽起步较晚,但是发展迅速,已在世界健美操领域中占有一席之地,但是
叉车的人机工程设计还有色彩以及造型设计是叉车设计的主要部分,这三个方面进行分析与研究,给出更为合理的设计思路,以人体模型为模板进行相应的验证,叉车的参考价值是由一些设计