基于空间金字塔注意力和动态加权决策的表情识别研究

来源 :广西大学 | 被引量 : 1次 | 上传用户:ynsyxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部表情能自然而高效地反映人们的心理活动和思想状态,在诸多智能化应用中,人脸表情识别(Facial Expression Recognition,FER)是人类与机器间建立起情感交互的重要基础。FER在个性化推荐、社交应用、医疗健康、自动驾驶等诸多新兴交互系统中具有良好的应用价值。近年来,深度卷积神经网络(Convolutional Neural Networks,CNN)技术取得长足发展,这为FER的研究提供了行之有效的工具。本文基于CNN的基础架构,对CNN网络的特征提取阶段和融合决策分类方法进行研究,旨在提升表情识别的准确率、提高网络的鲁棒性,本文的主要工作如下:1、介绍FER任务面临的挑战以及自动人脸表情识别系统的实现方法;概述了FER主要改进方向及国内外研究现状及CNN算法的相关理论基础,并在此基础上分析了当前FER领域领先模型的技术路线。2、针对特征提取网络对于表情产生关键区域关注不足导致的细节特征信息丢失问题,本文将词频-逆文档频率和空间金字塔注意力机制相结合,构建词频-逆文档频率空间金字塔注意力模块(Term Frequency-Inverse Document Frequency Spatial Pyramid Attention,TF-IDF SPA),调整网络对表情产生关键区域的注意力分布,强化对表情产生关键区域的特征提取能力。在使用TF-IDF SPA注意力模块嵌入CNN堆叠训练网络后,本算法在FER2013和CK+数据集上分别达到73.52%和98.27%的识别准确率,在识别准确率上达到了具有竞争力的水平,优于使用SENet、SPANet等注意力机制嵌入网络时取得的效果。3、针对单一分辨率卷积神经网络对表情识别的局限性,引入基尼指数改进用于多分辨率CNN网络的动态加权决策算法,对含有多个输入支路的网络进行融合决策。所改进的基尼指数动态加权决策算法(Gini-index Dynamic Weighted Decision,GDWD)首先使用TF-IDF SPA注意力嵌入HRNet搭建3个不同分辨率的支路,分别进行Softmax分类后将输出结果构建成概率矩阵,接着计算概率矩阵的基尼指数高低,根据基尼指数动态地调整各支路的输出权重,自动提高分类确定性高、性能好的支路权重值,降低分类性能差、确定性低的CNN支路权重值,避免由于单路CNN分类不确定性引起的偶然误差,提高多支路输入网络融合决策的准确性。最终,使用TF-IDF SPA嵌入HRNet训练模型后,使用基尼指数动态加权决策算法进行分类,识别准确率在FER2013和CK+数据集上较HRNet分别提升了4.41%和3.66%,与多个新型的人脸表情识别模型对比,该方法在识别准确率上达到了领先水平。
其他文献
根据达尔文的自然选择理论,理性个体总是倾向于选择背叛行为。然而,合作现象能够普遍存在于自然系统与人类社会中。如何理解和解释社会困境中自私个体之间合作行为的自发涌现和维持依旧是一个具有挑战性的科学问题,吸引了不同领域众多学者的持续关注。在演化博弈理论这一强有力的理论框架下,出现了大量的涉及不同结构群体(如方格子网络、随机网络、小世界网络和无标度网络等)和各种社会困境(如囚徒困境博弈、雪堆博弈和公共物
学位
期刊
在机器学习的许多实际应用中,存在着许多数据不平衡的问题。传统机器学习算法往往以总体的分类准确率为目标,在对不平衡数据分类时容易忽略少数类。虽然当前对分类任务的数据不平衡问题研究较多,但对于回归任务的数据不平衡问题的研究较少。而在热带果树寒冻害预警问题中,气象数据集通常是不平衡的,即对热带果树造成寒冻害的天数较少,果树正常生长的天数较多。故针对传统机器学习算法在分类不平衡数据时容易忽略少数类的问题,
学位
随着车辆的普及和无线通信的发展,车载自组织网络VANET得到了广泛应用,但是车载自组织网络需要提供相应的网络服务质量(Quality of Service,QoS)来满足网络应用需求。而车辆的高速移动导致车辆自组织网络的网络拓扑结构动态变化,所以车载自组织网络QoS路由相比传统的QoS路由更加难以求解。研究适合车载网动态拓扑结构和复杂网络环境的QoS路由算法,对于提高车载自组织网络的应用性能有着重
学位
多项式乘法计算应用于许多通信系统、信号电路以及图像处理算法中。在多项式乘法计算中,系统往往需要对大量数据进行高效处理,并输出结果。研究多项式乘法计算的关键,在于多项式矩阵乘法的应用与运算。随着多项式矩阵乘法结构日趋复杂,大型矩阵的高效运行和计算正不断面临更大挑战。由于多项式具有多变量、大规模等特点,目前仅依靠软件算法尚不足以满足实际需求。因此,亟需一种硬件加速平台的方式,以适应于多项式乘法日趋复杂
学位
随着我国经济社会的高速发展,对道路交通质量提出了更高的要求,因此修建了大量的桥梁,由于桥梁特殊的工程结构、自然灾害以及长期高荷载运行的影响,会造成桥梁结构损伤,比如拉索的激振和腐蚀,对桥梁的安全运行形成威胁。因此,对桥梁运行状态进行监测是一项非常必要的工作。为此,论文针对桥梁的安全运行设计了一套监测系统,该系统主要包括以下3个部分:1、混凝土泵送压力状态监测模块;2、基于应变片的桥梁拉索索力测量模
学位
随着社会的发展,公有公共设施在日常生活中发挥着越来越重要的作用,与之伴随的是公有公共设施致害的情况越来越多,目前,我国《国家赔偿法》的赔偿范围尚不包括公有公共设施致害,公民面对致害问题时只能通过民事法律来解决。由于民事法律具有一定的局限性,因此有必要将公有公共设施致害的问题纳入国家赔偿的范围,对实体和程序上的问题明确法律适用。
期刊
射频识别(Radio Frequency Identification,RFID)是实现物联网的关键技术,RFID技术应用范围广泛,如车辆管理、生产管理、人员管理、食品安全等领域。RFID网络规划(RNP)是RFID研究领域最具有挑战的难题之一,RNP是一个典型的多目标优化问题,为了让RFID系统有效覆盖标签,应找到规定区域内阅读器的总数以及它们应该放置的最佳位置。本文为解决RFID网络规划问题,
学位
信道编码技术是实现未来通信系统性能更高标准的关键技术之一。因此,信道编码技术应具有编码增益大、复杂度低、时延低、数据吞吐量高以及编译码灵活性强等特征。而作为典型的信道编码方案LDPC码(低密度奇偶校验码)具有译码复杂度较低,且易于采用并行译码的技术特点,通过精心设计的LDPC码可实现很低的错误平层,完全可满足高吞吐量及可靠性方面的需求。基于上述LDPC码的优异性能,目前,准循环LDPC码已被确定为
学位
期刊