基于视频序列的人脸表情识别算法研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:mmmzyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别任务分为基于静态图片的人脸表情识别和基于视频序列的表情识别。本文研究基于视频序列的人脸表情识别。首先,本文提出了一种基于混合表达输入的统计特征提取与分类算法。该算法的创新之处在于,利用在静态表情数据库上训练好的表情识别模型提取视频中的序列图片特征,然后计算特征的统计信息,利用Linear SVM分类器对统计信息进行动态表情分类。此外,本文还提出了一种混合表达的网络输入模式,该输入是由预处理后的人脸灰度图片和人脸LBP图谱合成的,该混合表达不仅保留了原始图片的细节信息,同时强调了人脸表情实现的关键区域信息,更有利于表情识别。为了更好的利用表情视频中的时序特征,本文提出了一种端到端的深度时空人脸表情识别网络FP-VGG-GRU,充分考虑不同网络层级的特征对表情识别的贡献。该网络结构简单,易于扩展,且具有较好的动态表情识别效果。最后,本文利用加权投票机制下的模型融合方法,结合人脸表情图片的空间信息和视频的时序相关信息,完成视频序列的人脸表情预测。在模型训练的过程中,本文主要利用Softmax loss和隔离损失(Island loss)学习人脸特征表示,分析了动态调整不同损失函数的比重对提升表情识别效果的重要性。同时,本文提出了一种序列重排序的数据增强方法,用以提升算法性能。本文在动态表情数据集AFEW7.0上进行实验,实验证明,本文提出的融合模型取得了较好的表情识别效果。
其他文献
近几年,河南省GDP总量虽然在增加,但增长率却出现了逐年下降的趋势,由2014年的8.9%下降到2019年的7.0%。除了中国经济整体速度放缓,发展速度由高速增长向中高速增长转变的因
目前,城市规划和计算领域主要研究方向集中于基于历史数据的短期人流预测、交通发生量预测以及城市发展模型构建,主要帮助交通管理、安全服务和城市长远整体发展规划,但是无法有效帮助城市规划者进行城市区域的设计。本文从城市区域的建成环境数据提取网格化特征,预测该区域对应的24小时人数演化的完整流程,可以帮助城市规划者进行区域规划。本文LBS(Location Based Service)数据采用了南京201
泸定水电站大坝主体填筑坝料有8种之多,为满足大坝整体填筑要求,需全断面、全工序全面填筑,填筑量大,强度要求高,且在填筑进度上由于防洪度汛及总体工程进度要求,时间紧迫、填筑强
氮素是植物生长发育所必需的营养元素之一。作为氮的主要形式,硝酸盐(NO_3-)和铵盐(NH_4+)也可以作为信号调节植物的生长。小麦是人类主要粮食作物之一,其产量与氮素供应密切相关。植物根系是吸收养分,感知营养缺乏的重要器官。虽然已经有部分研究报道了小麦对低氮胁迫的响应,但小麦(Triticum aestivum L.)根系对低氮胁迫(特别是低NH_4+胁迫)应答的转录调控尚不十分了解,因此研究小
1临床资料患者,女性,40岁.于11年前妊娠后发现血压升高,最高达170/110 mmHg,曾多次查肾上腺超声未发现异常.4年前开始出现夜尿增多,一直按原发性高血压病治疗.
声学多普勒流速剖面仪(ADCP)是现代水文测量中的常用仪器,主要用来测量河流和海流的流速。ADCP系统利用了声学多普勒效应,通过估计回波的多普勒频移计算出相应的流速。复杂的
网络仿真技术是研究人员进行网络规划与设计时的重要工具.本文首先介绍了OPNET的网络仿真性能和特点,接着分析了OPNET的建模过程,最后通过一个实验讨论了OPNET技术在网络规划和
本文就两河口库区复建省道桥梁预制T梁施工,从钢绞线张拉施工、混凝土施工两个方面进行论述,经工程实际施工检验,此技术安全可靠,可实现桥梁施工模块化,施工进度快,能很好的适应高
伴随着证券市场的发展,股票分析师行业的壮大,如今分析师不仅拥有完备的数据搜寻渠道,同时掌握专业的财务分析能力,和信息薄弱的外部投资者相比,具有得天独厚的优势。因此投
在美术教育开展的今天,取得了很大的进步,高校美术教学改革也势在必行,高校美术教学在课程改革的大的背景下也必将面临着打破传统的教学局限,本文并结合当前美术相关行业的需求,构