基于多网络的有遮挡动态表情识别研究与应用

来源 :青岛大学 | 被引量 : 0次 | 上传用户:yiluyouyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年面部表情识别在智能服务设备、虚拟网络交流、医学治疗、司机疲劳监控、心理学等诸多领域都已经具备了广阔的研究和应用前景。但是在实际交流中光照、阴影、姿态等变化会对面部表情产生一定的遮挡,因此面部表情会丢失局部的重要信息,进而会使得面部表情识别鲁棒性较差。另外,仅对图片进行表情识别,忽略了现实生活的动态表达,表情识别结果缺乏真实性。因此,本文针对以上问题,优化生成对抗网络结构、进行卷积网络的最佳级联来提高面部表情识别率。主要工作及创新点如下:1.设计了一种表情遮挡补全的生成对抗网络结构,构建并行网络结构PIncepNet(Para Inception Net)进行上下文特征提取,利用条件对抗网络对不同程度遮挡区域进行补全,增加了生成模型的宽度,新的局部遮挡补全网络可以进行更完善的特征学习。该网络为Inception结构内的并联和Inception结构外的并联,用不同的卷积核学习不同空间尺寸的信息,1×1卷积减少特征图的深度,众多有差异的特征图输出在通道上融合。在Celeb A和MMI数据集上进行不同程度的随机遮挡实验证明,与传统生成对抗网络相比,本文的表情遮挡补全网络的遮挡修复更真实,网络模型更加稳定。2.构建P-IncepNet-LSTM网络结构进行动态表情识别,P-IncepNet网络模型提取人脸表情图像的特征表示,然后将这些特征输入时序网络LSTM(Long ShortTerm Memory,LSTM)来增强时间信息编码,LSTM的一个隐藏层设计为128个嵌入节点,此外在LSTM隐藏层的顶部还添加了dropout层,防止训练过拟合。与C3DLSTM等级联的网络的对比实验证明,该网络结构不仅对无遮挡表情识别效果优异,并且对有遮挡的表情识别平均有4.45%的贡献率。3.联合遮挡补全与表情识别网络,建立了遮挡表情实时识别系统,应用在安全驾驶中实时监测驾驶人员的表情,防止路怒症等不良心情导致的交通事故。利用改进的生成对抗网络训练表情补全的最佳模型,在表情识别级联网络中调用该补全模型,实现有遮挡的动态表情识别,并构建系统可视化界面。
其他文献
高维数据通常存在于低维子空间中,随着现实世界中数据量变得越来越多,数据类型越来越复杂,通过恢复低维子空间来揭示数据内部结构性信息的技术也变得尤为重要。数据量的增多给予了数据标记工作很大的压力,而聚类作为无监督学习方法则有效的避免了这一难题。随着数据维数越来越大,信息量越来越复杂,传统的聚类算法在聚类分析时效果不理想。在多种聚类算法中,子空间聚类从数据本身的性质出发,利用数据集的低秩性和稀疏性,成功
图形与几何是初中数学教学的重要内容,通过对图形与几何知识的研究和学习,能够使学生提高空间观念、推理能力和几何直观。图形和几何也是中考重点考察范围,是提高学生直观想象核心素养的主要途径。新课标中初中图形与几何教学的内容分为图形的变化、图形的性质、图形与坐标。其中勾股定理作为千古第一定理,且作为八年级第一章的内容出现,在后面的应用中至关重要,是培养学生几何思维水平由分析水平和非形式化演绎水平过渡到形式
中考是初中结业考试,也是高中的升学考试,是对学生基础教育阶段的重要评价,因此,研究中考试题对中考命题和教师教学都具有重要意义.本文研究对象为2016-2020年青岛市中考数学试题,利用比较分析法、文献分析法及统计分析法对试卷进行结构分析,再从核心素养的角度对试题中各类题型进行分析,最后根据喻平的数学核心素养评价框架对试题进行数学核心素养测评,得出以下结论:1.试题重视对核心素养的考查,不同类型的题
具有高反光弧面的金属产品广泛应用于各行各业。由于高反光弧面强镜面反射特性及弧面视角遮挡,基于视觉的表面缺陷检测存在困难。本文针对具有高反光弧面的管材产品,设计基于流水线的表面缺陷检测系统,并提出了多种基于视觉分析的检测方法及比较分析。本文具体研究内容如下:1.首先,分析了高反光弧面对缺陷检测的不利影响,为解决上述对缺陷检测的不利影响,本文分析了基于固定多视角方式设计的高反光弧面缺陷检测系统优缺点,
随着信息共享的推广和普及,数据库作为一种信息存储工具被广泛使用和传播。数据库在传播和共享的同时,也出现了各种数据库侵权及盗版问题。数据库被恶意传播及复制,对原数据库所有者的利益造成了极大的损害。有关学者就相关问题提出了关系数据库水印技术,即通过在数据库中加入一些微小错误来证明数据库版权归属。然而,由于当前大部分数据库水印方案仅通过密钥及水印串进行一次嵌入,在检测时无法控制水印恢复的比例,因此,大部
图像分割技术研究的重点在于分割目标的精度和速度。目前已出现多种边缘提取及区域分割的模型和方法,但很多方法仍然存在着计算效率低、分割精度不高、鲁棒性差等问题,所以分割的精度和速度还是有待研究和改进。Chan-Vese模型是经典的图像分割变分模型,多相图像分割是Chan-Vese模型的成功延伸。本文以Chan-Vese模型为例,提出两种快速迭代求解方法,该算法适用于Chan-Vese模型的图像分割,并
数感在《全日制义务教育数学课程标准(实验稿)》2001版中第一次被明确提出来,2011年我国颁布的《义务教育数学课程标准》中再一次强调了数感的重要性并成为十个核心素养之首。数感是学好数学的基础,因此在数学学习中有着至关重要的作用,通过对学生数感的调查研究,可以帮助老师了解学生数感的现状,更好的指导教育教学,从而促进学生数感的发展和数学水平的提高。本研究针对青岛市A、B、C三所初中进行调查,首先通过
在立体图像质量评价(Stereoscopic Image Quality Assessment,SIQA)领域,如何有效地模拟人类视觉系统(Human Visual System,HVS)对图像质量进行评价是一个重要且具有挑战性的问题。考虑到人眼视觉特性对图像质量评价的影响,本文详细介绍了HVS的基本结构,并且对其产生的视觉感知特性进行了详细分析。为了结合人眼视觉特性,设计出更加符合人眼视觉感知过
人工智能已经在大数据分析、计算机视觉、语义分析等各个领域做出了重大突破,卷积神经网络(Convolutional Neural Network,CNN)是它的一种研究方法,在计算机视觉领域充当着重要角色。在近些年,卷积神经网络在人群密度估计研究上做出了一次又一次创新突破。受空间透视,遮挡严重,光线变化等问题的影响,人群密度估计在研究上仍然面临一系列挑战。在目前的卷积神经网络研究领域,多特征融和概念
近年来,公共交通的快速发展,公交车成为了居民出行的一种首选的方式,但是目前在城市公交中存在着许多问题,城市公交的流量巨大,但是在公交调度方面有许多不合理的地方,尤其在早晚高峰期间,公交线路规划的不合理,致使某条线路的安排不合理或者某辆车上乘客过少等问题。为了解决这些问题,一个准确实时的客流数据就会成为关键问题。目前,由于智慧城市建设的不断推出,客流数据变得尤为重要,客流数据统计越来越成为智慧城市建