视频中人脸表情识别方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:ken112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情作为一种传达信息的方式,在人类交流中起到了重要的作用,对人脸表情进行研究可以更好地理解人类的心理活动和情绪状态。人脸表情识别在安全、驾驶领域、医生诊断、教育等方面有着广泛的应用。目前,图像中的人脸表情识别技术得到了广泛的研究,然而表情是一个动态变化的过程,视频中人脸表情识别更能体现表情变化的真实情况。视频中人脸表情识别有三个关键性问题:第一,现有视频人脸表情识别研究工作主要应用于商用领域或竞赛,因此该领域相关研究机构以大型企业为主,也因为商用的原因而没有公开代码,必须从头搭建整个网络;第二,需要同时考虑视频帧的静态人脸表情特征提取和帧间动态时间特征的提取;第三,视频表情数据集存在数据分布不均衡和小样本数据问题。针对以上问题,本文提出了结合全局和局部时域的视频人脸表情识别模型,并在此基础上引入迁移学习算法解决了数据集存在的问题。本文主要的工作和创新点如下:(1)本文提出了一种结合全局和局部时域的视频人脸表情识别模型,整个模型分为全局时域信息提取、局部时域信息提取和加权投票三个模块。在全局时域信息提取模块,使用二维卷积神经网络结合循环神经网络同时提取视频序列的表情特征和全局的时间特征。在局部时域信息提取模块,使用三维卷积神经网络同时提取视频帧序列的表情特征和局部时间特征。在加权投票模块,对其它两个模块的输出结果进行加权投票,从而达到更好的识别结果。通过在CK+数据集和AFEW数据集上进行实验,本文提出的结合全局和局部时域的视频人脸表情识别模型分别达到了94.19%,和46.71%的识别准确率。(2)针对视频人脸表情数据集存在的数据分布不均衡和小样本数据问题,在结合全局和局部时域的视频人脸表情识别模型的基础上引入迁移学习算法,整个模型分为基于网络的深度迁移学习模块、基于映射的深度迁移学习模块和加权投票模块三个模块。在基于网络的深度迁移学习模块,对模块中的网络先使用VGGFace2和Image Net数据集进行预训练,将训练好的网络结构和参数迁移到视频人脸表情识别问题中,再用AFEW数据集对网络进行微调。在基于映射的深度迁移学习模块,将源域和目标域数据集通过三维卷积神经网络提取到的高层特征映射到高维空间进行适配,从而增加高层特征的可迁移性。通过在AFEW数据集上进行实验,在模型中加入迁移学习方法可以解决数据中存在的数据分布不均衡和小样本数据问题,识别准确率提高到了59.11%。
其他文献
高光谱成像(Hyperspectral Imaging,HSI)技术自上世纪末首次用于遥感技术以来,发展迅速。如今HSI技术不仅应用在遥感和地球观测领域,而且在农业,食品加工,监视,眼保健,环境和化学成像等其他领域也被广泛应用。作为一种新兴技术,HSI技术结合了先进的光谱学和成像技术,可为光谱和空间分析供足够的信息,因此被认为适用于微纳米级材料的分布研究和特性研究。目前,HSI技术的应用已经从宏观
近年来,“订阅经济”的时代已经来到。如今的消费者有了一系列新的需求。他们想要定制化,而不是大众化;他们想要可以预见的收获,而不是仅仅拥有所有权。正因如此,如今的企业急需改变商业模式,从原来的以商品为中心的模式变为订阅业务为中心的商业模式。从全球范围内看,一系列以订阅模式为主导的业务模型正在急速发展,涌现出一批新的商业巨头:Netflix,Amazon Prime,Spotify,Salesforc
随着“推荐式”流量的兴起,用户画像系统逐渐变成了近年来的热门研究领域。阿里的达摩盘、百度的司南、腾讯的社交大数据平台等系统的出现,代表“用户画像”逐渐成为了一个互联网企业所必备的能力之一。但随着用户画像系统的飞速发展,传统的用户画像系统暴露了诸多弊端,例如业务不聚焦、时效性差、分类粒度太大。本文通过设计实现基于特征标签的商家画像系统,解决了公司在商家运营场景下精准触达困难、数据分散、业务变更频繁、
长期以来房地产业促进了我国的经济发展。2020年我国的互联网普及程度达到新高。房产信息服务平台作为房地产业与互联网技术相结合的产物,逐渐成为人们获取房产信息的重要工具。然而如今的房产信息服务平台存在一些问题。一方面,随着业务体量的增大和用户数量的增多,当前平台的应用架构已经无法满足性能、开发效率、搜索引擎优化等方面的非功能性需求。另一方面,随着房地产业线上业务的快速变化,当前平台已经不能满足用户全
随着微机电系统的飞速发展,微尺度相关的应用变得越来越广泛。换热器和化学反应器逐渐向着微型化和高度集成化发展,这也意味着入口效应不能被忽略。对于短通道来说,入口段的长度占总体长度比例较大,因此必须考虑入口效应带来的影响。然而目前对于入口段的研究还不够充分,存在着一些基础性的问题。深入研究入口效应将为现代高新技术的应用和发展奠定基础,具有重要的工程价值和学术意义。本文基于套管式换热器和微化学反应器为工
学位
随着资源环境问题日趋严重,氢能作为一种环保的新型能源成为各国的关注热点。燃料电池汽车是氢能在交通运输领域中的重要应用。氢气属于易燃易爆气体,且易泄漏并能在空气中快速扩散。氢气一旦由燃料电池汽车氢气系统意外泄漏后,很有可能燃烧或爆炸,对驾驶员及周边环境造成伤害和破坏。因此,本文对燃料电池汽车氢气泄漏扩散过程进行了数值模拟研究,对于氢气泄漏扩散特性的理解与燃料电池汽车氢气泄漏扩散的安全预警具有一定理论
车路协同是智能网联汽车和蜂窝车联网重要的发展方向,车载天线是这一系统中信息交互的关键设备。车载天线的性能评价是当前研究的热点内容。本文借助理论推导、仿真分析和实测验证等手段对整车条件下车载天线性能和典型测试场地做了初步研究。研究了整车条件下车载天线的性能。通过对比车载天线单体和天线在整车条件下的仿真结果发现,整车条件下车载天线的方向图中出现分瓣,波束指向发生变化,等效半功率波束宽度变窄,不同方向E
在信息化技术的推动下,来源于医疗决策、金融风险评估和环境决策等众多领域的决策活动在频率、广度以及复杂性上较传统的决策活动有着本质的差异,亟需解决增多的不确定因素的影响和未来演化趋势的评估等挑战。针对上述挑战,本文从多属性决策与认知学习、进化学习和集成学习多学科交叉融合的角度,开展基于模糊认知图的动态多准则决策方法研究,具体研究内容包括:(1)研究基于改进Jaya学习的模糊认知图方法。模糊认知图作为
近年来,无人汽车得到了快速发展,定位技术作为无人汽车实现决策、规划与运动控制的基础,成为了无人汽车领域的研究热点。目前,应用于无人汽车的定位方式存在精度低、成本高、易受环境影响等问题。如今5G通信技术开始普及,其低时延、高速率和覆盖范围广的特点可极大提升无人汽车定位的准确性和实时性,具有广阔的应用前景。本文在5G关键技术的基础上,研究了5G环境下的无人汽车定位方法,提出了基于到达角(Angle o