基于深度学习的人脸表情识别方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:wyoo00oo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能机器和人工智能的发展,计算机情感分析已越来越重要。其中人脸表情识别作为情感信息交流的感知手段在教学认知状态分析、患者情绪状态分析、公共区域危险预警、盲人视觉感知等领域有广泛应用潜力。因此,作为智能交互、情感计算的关键技术,近年来人脸表情识别成为人工智能研究重点。鉴于人脸面部表情具有高维、非刚性、多尺度变化、易受光照和角度影响等特点,通过计算机获取面部表情图像或视频,分析面部形态和变化来准确获得对象的情绪变化相当困难。当前国内外研究者多从特征提取和分类器设计方面进行探索与研究,并提出基于全局特征、局部特征、梯度特征、模板特征等方法。迄今为止,将这些方法与技术应用于各类复杂的自然场景时仍然面临诸多问题:1.现有浅层特征提取模型有效解决了图像维度灾难问题,但同时导致有效鉴别特征信息的大量丢失,从而制约识别精度;以多特征融合、多尺度提取、多分类器结合等方式提升算法精度存在局限性,算法提升效果有限。2.应用场景复杂,人脸图像易受角度、姿态、光照、遮挡、多尺度等因素影响,引起算法识别结果波动很大,鲁棒性不高;场景的多样性和样本的大数据特性,要求建立复杂空间的识别模型,后验数据信息更新知识才能提升算法鲁棒性。3.现有的静态图像算法应用到自然场景中,缺乏对动态序列信息的有效利用,导致算法鲁棒性差;动态表情识别模型较少,且算法复杂,假设条件较多,应用效果有待改善。因此,本文以提高人脸表情识别的准确性和鲁棒性为目标,开展基于深度学习方法的人脸表情识别算法研究,探索视觉特征的自主学习模式,为构建更为有效的、端到端的视觉特征服务提供理论分析和技术支撑。本文主要创新性研究内容如下:1.提出一种基于变分推理网络的人脸表情识别方法。针对浅层模型存在有效鉴别特征信息丢失,提升准确性难度较大的问题,设计一种基于变分推理网络识别方法。该方法融合自编码网络分层特征学习和大数据样本非线性拟合的优点,利用变分推理算法快速生成表情图像的类别分布模型。通过输入实测表情数据训练变分识别网络,生成网络的隐变量的均值和方差;然后根据隐变量进行网络微调,形成稳定的概率生成识别网络。实验结果表明,该方法生成的概率特征模型能有效进行层级特征学习,形成复杂的非线性分类网络,相对于自编码网络、去噪自编码网络速度更快,准确性更高。2.提出一种基于深度置信网络的人脸表情识别方法。针对浅层模型存在有效鉴别特征信息丢失,提升准确性难度较大的问题,设计一种基于深度置信网络识别方法。该方法结合人脸区域分布特点,采用RBM进行数据建模与推理,融合局部和全局特征进行表情判别。首先,通过深层RBM形成分层特征自动学习结构,实现分区域面部特征的抽象提取;然后,根据后验样本获得贡献度,结合区域表情和整体表情形成混合生成模型,综合吸收局部特征和全局特征的影响。实验结果表明,该方法契合人脸表情分布特点,通过深度模型融合局部特征和全局特征,提高了识别算法的准确性。3.提出一种基于深度残差网络的人脸表情识别方法。针对大型卷积神经网络伴随网络深度加大存在的稳定性和收敛性问题,设计一种深度残差网络的识别方法。该方法结合残差单元的网络构建能力和卷积单元的图像特征学习能力,利用数据样本训练深层网络,形成复杂判别模型。输入分割图像到并行卷积网络,提取初级特征后进行聚合操作;采用残差单元叠加深层网络,用于进行聚合特征的深度学习。为方便融合多尺度特征,每个残差单元采用多通道方法进行残差学习;最后,对深度残差网络输出的特征进行分类学习。实验结果表明,采用残差学习构建深层识别网络,具有较高的识别准确性和鲁棒性。4.提出一种基于LSTM+RNN的动态人脸表情识别方法。针对现有算法对表情图像序列信息缺乏有效利用,算法应用鲁棒性差的问题,设计一种采用LSTM+RNN的动态表情识别方法。该方法采用RNN进行图像序列的循环采集,LSTM学习和记忆序列关联信息,结合单图像信息和序列关联信息进行表情判别。利用小尺度图像数据快速定位图像中人脸的位置,再通过卷积神经网络实现视觉特征的提取;利用RNN建立整体的循环网络结构,单个LSTM单元学习图像序列数据关联特性。实验结果表明,该方法能够获取表情图像序列的相关性,结合当前图像信息进行类别判别,准确性和鲁棒性都有所增加。本文研究表明,利用深度模型进行端到端的表情识别探索,从表情图像数据进行视觉特征有效的、分层的、自动的学习,较好的获得了视觉区分特征和描述了图像的非线性特征,避免人工特征设计的经验需求和缺陷,是视觉特征应用研究的重要方向。
其他文献
本文针对目前我国翻译教学中关于建构主义的模糊认识,系统阐述了建构主义4个基本学派的主要观点,揭示了各个学派对翻译教学的启示。文章提出翻译教学应融合建构主义各派之长,
国内旅游人类学的研究起步较晚,创新性不足。但近年来,众多学者运用西方人类学的研究方法和成果对国内的旅游现象进行了深刻的诠释,在旅游人类学的本土化上迈出了重要一步。
近年来,国家高度重视物流业发展,密集出台了一系列促进物流业发展的利好政策,为物流业发展营造了良好的环境。特别是国家“一带一路”战略的实施,不仅给我国物流业带来全新的发展
报纸
<正> 简牍秦代书法遗迹中最珍贵的要推1975年12月在湖北云梦睡虎地秦墓出土的1100余枚竹简。这些简文为墨书秦隶,是秦始皇统一全国后五六年的遗物。简长23.1-27.8厘米,以墨书
<正>随着我国人口老龄化程度的不断增加,冠心病的发病率亦逐年增加,起搏器的植入数量也逐年增加,随着科学技术与发展,起搏器功能和种类如雨后春笋,而永久性起搏器在临床应用
<正>主持人语:以"跨境"作为讨论民族在现代语境中的诸种关系,是现代民族国家(nation state)交给学者的"作业"。因为,就现代国家的历史形制而言,它只有两百年多年的历史。在这
世界上使用人数最多、信息存储最简练、运用最广泛的语言文字,是中国传统文化和世界文化不可或缺的重要部分,所以针对汉字图像的识别研究具有非常重要的实用价值。手写汉字识
"3S"技术作为当前信息管理的高新技术,在土地资源管理中具有广阔的应用前景。本文在介绍RS,GIS,GPS及"3S"集成的基础上,从土地利用调查、土地利用总体规划、土地利用动态监测
本文从遵义市会展经济发展重要性出发,阐述了遵义会展经济发展的条件,分析了构建发展会展业的优势与劣势,为遵义会展经济可持续发展提供了可借鉴的思路。
近年来,随着知识经济的蓬勃发展、互联网+时代的到来,企业在发展过程中对人力资源管理提出了更高的要求。企业人力资源管理也必然面临艰巨挑战,为了更好地适应新形式,许多企