基于深度学习的鲁棒表情关键点定位算法设计与实现

来源 :北京交通大学 | 被引量 : 4次 | 上传用户：sun763280

【摘要】

：

随着计算机技术的飞速发展,作为情感计算的一个重要方向,人脸表情识别逐渐成为研究的热点课题。近几年,深度学习的研究取得了突破性的进展,为其他研究领域带来了创新和突破的

【作者】

：

彭营营

【出处】

：

北京交通大学

【发表日期】

：

2017年01期

【关键词】

：

鲁棒关键点定位深度学习卷积神经网络人脸表情运动单元表情识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术的飞速发展,作为情感计算的一个重要方向,人脸表情识别逐渐成为研究的热点课题。近几年,深度学习的研究取得了突破性的进展,为其他研究领域带来了创新和突破的机遇。本文针对人脸表情识别所涉及的特征点定位技术进行了深入研究。基于深度卷积神经网络的非线性映射能力,实现和对比了三种基于不同网络结构的面部关键点定位算法,并将其与传统面部关键点定位算法进行了对比。考虑到表情关键点在人脸表情运动单元内的共生性,提出了一种新的基于多任务深度学习的鲁棒表情共生点检测及强度估计算法。论文的主要内容包括以下三个方面:(1)为了与基于深度学习的特征点定位算法对比,本文研究并实现了传统主动形状模型(ASM)和鲁棒级联形状回归(RCPR)算法。ASM算法是一种基于统计学的可变形模型,该方法通过训练建立可形变的模型,利用仿射变换参数的更新对局部纹理模型的特征点进行匹配,但该算法不具备对姿态和遮挡变化的鲁棒性。鲁棒级联形状回归(RCPR)算法是在级联形状回归(CPR)算法基础上的改进算法,该方法使用回归模型,并引入人脸形状索引特征和遮挡检测,算法具有针对面部形变和遮挡的鲁棒性。(2)论文采用卷积神经网络(CNN)结构进行特征学习,研究并对比实现了三种具有鲁棒性的面部关键点定位算法,分别是级联深度卷积神经网络(DCNN)算法,改进的由粗到精的级联深度卷积神经网络(CFCNN)算法以及基于多任务深度学习(TCDCN)算法。DCNN算法采用三级卷积神经网络级联的结构,利用无监督学习对每一级网络进行逐级训练,后一级在前一级网络定位的基础上微调,该算法可以检测出5个人脸关键点。CFCNN算法可以定位68个面部关键点,采用相互独立的级联网络结构分别预测51个内点和17个轮廓点,该算法定位精度较高,但对姿态及遮挡的鲁棒性弱。TCDCN算法将多任务学习与深度学习相结合,采用非级联的网络结构,把面部特征点定位作为主要任务,头部姿态检测作为辅助任务,对两者采用深度卷积神经网络联合学习,该算法提高了对姿态的鲁棒性,可对68个面部关键点实现更鲁棒、更快的检测。通过对AVEC 2012微表情库和自建数据集的实验结果的分析以及LFPW人脸库统计学结果的对比得出,在参与对比分析的五种典型算法中,TCDCN算法的面部关键点定位效果较好,其所检测得到的面部关键点可作为用于描述表情变化的候选点集。(3)考虑到人脸表情运动单元(AU)内部面部关键点的共生性,本文提出了一种新的基于多任务深度学习的鲁棒表情共生点检测及强度估计算法。AU是编码人类表情变化的基本单元,其内部的面部关键点是共生的,且其强度是表情所对应的心理指标(激活度、正负、期望度、强度)的重要描述子。因此,本文所提算法首先采用TCDCN准确定位出面部锚点,以此作为描述表情变化的候选点集,然后同时提取面部的几何特征和表观特征形成特征描述子,以AU区域内面部锚点的共生性作为约束,利用支持向量机和支持向量回归对其进行分类和回归,其中的分类过程即为鲁棒表情共生点的检测过程,而回归分析过程则可估计出鲁棒表情共生点的强度。SEMAINE和DISFA表情库上的实验结果表明,所提算法可以较好的检测和定位鲁棒表情共生点,并对其强度进行估计。

其他文献

北京大学继续医学教育策略与实践

近些年,在国家的大力推动下,北京大学医学部凭借其雄厚的师资力量和齐全的医学学科门类,以创建世界一流医学教育为宗旨,为国家培养了大量的医疗卫生人才.北京大学医学部举办

期刊

一幅浩瀚的时代星图

在评论家李敬泽的眼中，李洱是一位“最像小说家的小说家”。他是中国先锋文学之后重要的代表性作家。他的《花腔》曾被评为“新时期文学三十年”（1979—2009）中国十佳长篇小说。

报纸

供给侧改革下的高校会计人才培养问题研究

随着经济的高速发展和信息化、网络化时代的到来,创新型人才和应用型人才供给不能满足社会需求的问题日益突出,虽然各高校积极推广慕课、微课、翻转课堂等新兴教学方式和手段

期刊

供给侧教学模式有效供给市场需求

探究建筑施工中钻孔灌注桩技术的运用

现今社会的快速发展也带动了建筑行业的发展,这也使建筑物的结构形式日渐复杂起来。为了使地基结构的整体质量能得到提升,在施工过程中需要采用多样的施工技术和施工手段,这

期刊

建筑施工钻孔灌注桩技术

恒虚警问题研究

首先讨论了高斯杂波背景中雷达目标恒虚警检测的原理，然后通过分析慢门限CFAR、邻近单元平均恒虚警（CA—CFAR）检测性能的优劣，提出了改进型CFAR方案，并在计算机模拟统计的基础上对

期刊

CFAR杂波CFAR处理技术检测损失CFAR （Constant False Alarm Rate） clutter CFAR processing

胸腰椎转移肿瘤的手术切除和稳定性重建

目的探讨胸腰椎转移肿瘤的手术切除方式和脊柱稳定性重建方法的选择。方法对12例胸腰椎转移肿瘤分别采用前路,后路及前后路联合肿瘤病灶切除加人工椎体替代物辅助器械内固定

期刊

胸腰椎转移瘤手术切除脊柱重建内固定thoracolumbar metastasis lesion-resection reconstruction in

锁定加压钢板内固定与解剖钢板内固定在四肢骨折中的应用效果对比

目的对比锁定加压钢板内固定与解剖钢板内固定在四肢骨折中的应用效果。方法随机选取我院2011年1月-2012年9月期间收治的60例四肢骨折患者,按患者接受手术治疗的方式分为A、B

期刊

锁定加压钢板内固定解剖钢板内固定四肢骨折

重组人血小板生成素和免疫球蛋白治疗脓毒症相关性血小板减少症的临床疗效观察

目的：探讨分别选择重组人血小板生成素以及免疫球蛋白对脓毒症相关性血小板减少症患者完成治疗后获得的临床效果。方法选择我院2013年6月～2015年6月脓毒症相关性血小板减少症患

期刊

认知无线电系统关键技术研究

传统的无线通信当中,固定分配频段的方法使得频谱资源日益稀缺,然而调查显示目前的授权频段中频谱的使用并不充分。认知无线电技术因其能够以伺机接入方式使用已授权给主用户

学位

认知无线电频谱感知频谱共享协作感知多天线技术

基于“工作流”的教学方法能够提高继续医学教育的有效性

好医生网站对继续医学教育的有效性研究长期集中在通过微观设计来提高认知的有效率,在对学习元素和学习路径的应用领域取得了一些成果。近年来,就医量的大幅增加给基层医院造

期刊

基于深度学习的鲁棒表情关键点定位算法设计与实现

与本文相关的学术论文