基于光流特征的微表情识别算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:liuyu890501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微表情是一种面部肌肉运动微弱且状态变换迅速的面部表情,一个标准微表情的面部肌肉运动时长不超过1/3秒。微表情识别任务指的是对已知的微表情片段进行情绪识别,是基于计算机视觉与心理学交叉的主要情感计算工作之一。微表情是人类心理活动的一种外在表现,微表情所表达的情绪可以作为判断人类主观感受的重要依据,因此,微表情识别在刑侦学、测谎、安防等方面具有极高的研究价值。由于微表情变化迅速,所以,如何准确的捕捉面部局部区域的细微变化是微表情识别问题的研究难点之一。光流作为一种能够捕捉物体细微运动的信息表示,近几年在微表情识别问题上的应用也越来越广泛,借助于光流捕捉面部的细微变化可以有效地增强微表情识别的精度。所以基于光流特征的微表情识别算法具有重要的研究意义和应用价值。目前已经存在很多微表情识别相关的研究与算法,特别是基于光流的微表情识别算法在近几年的方法中获得了不错的性能,无论是基于光流的深度学习算法,还是基于光流的传统算法都获得了良好的识别性能。在传统方法中,光流特征描述子的设计是一个关键的步骤,但是,在特征计算时,为了降低特征的维度往往需要对光流进行稀疏化处理,这将会丢失部分面部关键运动信息。在深度学习方法中,首先计算出包含面部运动细节的光流数据,然后将光流数据输入到所设计的网络中进行特征重建和细化,以进一步改善特征的表示。现有的一些方法直接将光流的分量作为网络的输入并没有考虑到各类微表情在方向上的差异。同时微表情数据集的规模有限,网络架构设计的合理性方面也存在诸多的困难,微表情识别精度的改善仍然是一个亟待解决的难点。综上所述,考虑到光流能很好地捕捉面部肌肉的细微变化,本文也使用光流来表示微表情的面部动态信息。但是,为了突出不同微表情在面部肌肉运动方向上的差异性,本文对光流分量进行了各向异性加权操作。同时,本文还提出了两种用于微表情识别的深度学习网络,并在网络中设计了多尺度特征捕获器来充分提取上下文的语义信息,通过结合多尺度的特征来改善模型的分类能力。首先,本文设计了基于通道注意力机制的微表情识别网络模型,该模型可以自动学习光流不同分量上的权重并完成微表情识别。为了改进上述模型的性能并改善识别模型的精度,本文设计了各向异性加权的光流图像,并使用本文所设计的单主干多尺度网络来训练识别模型以完成特征的提取与分类。本文的创新点总结如下:1.基于面部肌肉运动所产生的光流的水平分量和垂直分量,本文观察到不同微表情的面部变化在水平和垂直方向上存在差异,本文认为不同微表情在光流的两个分量上应赋予不同的权重,因此,本文提出了基于通道注意力机制的微表情分类网络。网络中的注意力模块可以自动学习每个光流分量上的权重来突出面部关键的运动信息,同时,为充分结合多种语义信息,网络中还构建了基于扩张卷积的多尺度特征捕获器,通过结合多尺度特征以增强模型的识别性能。2.在现存微表情数据集规模较小的情况下,为了降低网络出现过拟合的风险同时进一步提升网络模型的性能,本文对通道注意力网络进行了简化处理并提出了更加简洁且高效的微表情识别模型。具体来说,首先根据光流分量的模来计算每个光流分量的权重进而得到各向异性加权的光流图像,这种采用预先计算的方式代替了注意力模块的自动学习,有效地降低了模型参数量,从而降低了识别模型出现过拟合的几率。然后将各向异性加权的光流图像输入到本文所设计的单主干多尺度网络模型来完成微表情识别。本文将构造的识别模型在四个常用的数据集上进行了性能验证,并与先进的方法做了比较,实验结果表明,本文所提出的基于各向异性加权光流图的单主干分类网络模型能够获得更优异的识别性能。
其他文献
语言是开放型体系,具有强烈的时代特征,是伴随着社会的变化而发展的。其与当代政势变化、经济发展、科技进步、文化交流密切相关。在语言的变化中,发音和语法相对稳定,词汇较活泼,因为词汇集开放性、敏感性和代表性于一身。随着新现象、新事物、新思想、新观念的产生,与之相对应的词汇应运而生,这就是新词。新词的产生不仅丰富了词汇体系,而且反映了时代的脉搏,更体现了人们的思考方式和思维方法。本文以韩国国立国语院20
本文以“2020年世界人工智能大会云端峰会开幕式”为同声传译训练素材,旨在通过模拟实践实现两个目的:其一,探究电视同传的难度影响因素(即实践中的难点);其二,评析同传实践中的问题(亦即笔者的译入语质量),提出相应改进策略及解决方案。实践发现,电视同传的难度影响因素主要体现在语言及非语言两个层面,即源语信息高密度高、源语表达冗余、源语语义不清、发言人口音重等语言层面,以及演示文稿负效应和专业知识缺失
间充质干细胞(MSCs)存在于几乎所有的组织中,现已从骨片、骨髓、脂肪组织、脐带、胎盘和羊膜液等分离出。它能够分化成骨细胞、脂肪细胞和软骨细胞。近年来研究发现MSCs拥有强大的免疫调节能力和治疗多种炎症相关疾病潜能。它们能抑制T细胞增殖、B细胞分化、NK细胞毒性以及树突细胞成熟。虽然有报道MSCs通过吲哚胺2、3-双加氧酶(IDO),诱导性一氧化氮合酶(iNOS),前列腺素E2(PGE2),TGF
互联网和现代科技的发展极大地改变了人们的生活,许多现实世界中的活动都被带入到了网络虚拟空间中,其中就包括人们的休闲娱乐活动。网络空间中借助多种娱乐方式产生了许多群体。本次研究借助参与观察和访谈等方法获取真实的一手资料,对MOBA群体的群体认同进行研究,对该群体内部的群体认同过程和群体认同危机进行研究,同时在亚文化理论的指导下对MOBA群体内部群体认同所产生的影响进行分析,提出相应的解决措施并对网络
随着新生儿重症监护医疗水平的提高和发展,早产儿存活率有明显提高,与此同时早产儿支气管肺发育不良(broncho-pulmonary dysplasia,BPD),发病率也有明显增加;由于早产儿的肺血管内皮细胞对高氧、炎症引起的氧化损伤特别敏感,因此接受机械通气、氧疗后的早产儿肺出现肺水肿、肺淋巴管扩张、肺纤维化为主要病理特征的BPD。同时,BPD诱导引起的后遗症状越来越多,给患儿身心健康、家庭、社
当代中国乡村社会转型过程中,传统农村社会的政治、经济、文化各个方面都发生了一定的转变,随之带来的是农民传统权力观念、生存环境及利益格局等方面的改变。倘若农民的利益诉求不能得到有效满足,一定程度上会带来农村社会秩序的紊乱。只有真正了解了当下社会背景中农民真实的心理、行为选择及其背后的逻辑,我们才可能真正去认识和解释中国农民的行动,找到实现农民、基层组织、国家之间和谐发展的道路。1997年开始推行的农
本论文旨在探讨黄龟渊口传文学的多元故事化以及文化素材综合应用,对黄龟渊口传文学的传承状貌和文化意义进行考察,并以黄龟渊的口传文学为原型,力求探究基于文化原型和一源多用(OSMU)方法为主的多元故事化与活化应用,并探讨如何将黄龟渊的口传文学通过各种媒介的开发,最终转化为多种文化产品的多元故事化途径及其对策。本文首先作为理论研究,提出多元故事化概念,剖析一源多用(OSMU)策略的基本理论,并探究媒体转
论文将中国朝鲜族的韩国体验与认识分为几个阶段,分析了其得与失,并运用后殖民理论与离散诗学,去考察了朝鲜族这一特殊族群所具有的文化身份双重性,继而对这一群体所处的边界空间暗含的文化创作潜能,进行了可行性探讨。在此基础上,根据韩国认识的深浅、文化身份的认同变化、主题意识与艺术形式的变化等为准绳,对相关作品分为三个阶段,进行了进一步的分析。1)散文自“88首尔奥运会”以后,亲历过韩国生活的朝鲜族作家所创
语言在生活中是必不可少的沟通交际工具,也是人类所特有的交际工具,随着人类社会而产生和发展。人们通过使用语言保存和传递人类文明的成果以及个人情感的表达。生活中的语言大部分以文字和语音的形式存在并被使用。其中,语音是语言的物质外壳,是语言的外部形式,是最直接地记录人的思维活动的符号体系。它是通过人的发音器官发出的具有一定社会意义的声音。音高、音强、音长、音色,是构成语音的四要素,同时也是语音的物理基础
科学技术的繁荣发展带给人们诸多便利,三维数据的展现形式层出不穷,逐渐转变着人们的生活模式和思维形式。点云是物体或场景的空间形态和颜色信息的一种特殊表示形式,通常由三维扫描仪或RGB-D相机获取。但是由于摄像机的视角限制,每次三维扫描设备只可记录一定范围内的点云数据,因此需要使用点云配准算法将不同角度的点云进行对齐。三维点云配准作为视觉范畴的经典研究问题,在三维建模、动画设计、文物修复、医学模型处理