基于时空神经网络的动态情感识别研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:r54321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感识别在人机交互中具有巨大应用价值,近年来受到越来越多的关注。在情感识别的研究过程中,研究者首先采集如面部表情序列、脑电(Electroencephalogram,EEG)以及语音等多种反映人类情感的信号,然后利用计算机进行自动识别。其中,EEG和面部表情序列是情感识别中研究较为广泛的两种信号。作为时变情感信号,EEG和面部表情序列具有相似的时空结构:它们不仅在某个时刻呈现特定的空间分布特性,也在时域上包含上下文信息。为实现准确可靠的情感识别,情感信号中所包含的较为关键的空域和时域相关性应该被很好地建模。出于上述动机,本文设计了多种具有时空结构的深度神经网络以实现基于EEG和面部表情的动态情感识别。此外,由于情感信号在空域上的相关性比时域上更加复杂,本文首先对如何建模空域相关性展开研究,并将它作为设计时空神经网络的基础。具体而言,本文主要的创新性成果包括以下几个方面:(1)提出一种受情感认知机制启发的双线性卷积网络(Bilinear Convolutional Network,BCN),对静态表情图像进行高层特征提取以及情感识别。为模拟情感认知的早期感知过程,本文首先对面部关键点的周围区域提取尺度不变特征变换(Scale Invariant Feature Transform,SIFT)描述子,并构建具有特定结构的特征矩阵。而为了模拟情感认知的深层感知阶段,本文构建BCN以学习具有较高判别性的情感特征。其中,BCN包含双线性映射层、一维卷积层和非线性激活层等多种网络层。在情感识别过程中,BCN能够很好地表征SIFT特征矩阵与其对应的高层语义信息之间的变换关系。同时,BCN对于不同视角下的面部表情也可以进行有效地分类。(2)提出一种新颖的时空递归神经网络(Spatial-Temporal Recurrent Neural Network,STRNN)用于学习情感信号中的空域和时域相关性,并将EEG和面部表情序列这两种信号的时空特征学习过程集成到统一的深度模型中。STRNN首先采用一个多方向的空域递归神经网络层(Spatial Recurrent Neural Network,SRNN)来捕获情感中的空域协同变化信息,特别是空域上各区域间的长距离上下文信息。在此过程中,SRNN沿着不同方向对情感信号中每个时间切片上的空间区域进行遍历。然后,双向时域递归神经网络(Temproal Recurrent Neural Network,TRNN)在SRNN输出特征的基础上进一步学习时域上的相关性。为选取对情感识别贡献较大的区域,该网络还对SRNN和TRNN的隐状态进行稀疏投影。经过上述过程,STRNN可以有效地学习情感信号中时域和空域上的相关信息,并实现情感识别。(3)提出基于一阶和高阶统计特征的深度神经网络框架,对EEG信号进行情感识别。其中,高阶统计特征为具有时空结构的对称正定(Symmetric Positive Definite,SPD)矩阵。理论上,SPD矩阵分布在黎曼流形上。为保持输入矩阵的黎曼流形结构,本文提出一个端到端的深度流形到流形变换网络(Deep Manifoldto-manifold Transforming Network,DMT-Net)将SPD矩阵从原始黎曼流形变换到另一个判别性更高的黎曼流形上。在此过程中,DMT-Net提出三个新颖的网络层以学习具有较高判别性的SPD特征,分别为:(a)局部SPD卷积层,(b)非线性SPD激活层,和(c)黎曼流形上的递归层。它们均可以保持输入特征的SPD特性并且在计算过程中无需使用运算复杂度较高的奇异值分解(Singular Value Decomposition,SVD)。而相比之下,现存方法几乎均基于SVD。此外,DMT-Net还包含一个对角化层用于对SPD特征进行高效的度量计算。最后,DMT-Net进一步和基于一阶统计特征的网络层进行融合以提高识别性能。(4)提出一种新的张量图卷积神经网络(Tensor Graph Convolutional Neural Network,TGCNN),对EEG信号进行情感识别。EEG特征首先被建模成包含多个节点的动态图序列。在此过程中,EEG的每一个时间切片均被视作动态图序列的一个子图,并且子图中的每个节点都与一个电极相对应。为全局地捕获各子图之间以及同一子图上的各节点之间的相关信息,TGCNN提出图保持层来递归地记忆各个子图上对于情感识别较为显著的节点。其中,图保持层包含两个关键的步骤,分别为跨图卷积和图池化。特别地,跨图卷积中提出一种新颖的参数化克罗内克和(Kronecker Sum)来表征两个子图中每对节点之间的邻接关系。通过利用克罗内克和的运算性质,原本针对高维矩阵的谱滤波运算可以分解为若干个低维矩阵之间的乘积,从而大幅减少内存和计算负担。经过对动态图的递归学习,图保持层可以捕获动态图序列的空域结构以及时域变化特性,并实现对EEG信号的有效情感识别。
其他文献
与固定坡率的边坡相比,二级或者多级边坡的形式灵活,具有广泛的工程实用价值。在该类边坡的施工设计中,稳定性分析是非常重要的工作。与极限平衡等手段相比,极限分析从能量角
李二曲(名)的哲学心路历程与其曲折清苦的人生感悟处处融合在一起,并产生震撼人心的力量。二曲早年既无家学,又无师承,但上接关学六百年之统,他严守张载以来关学学者"以躬
当代世界范围内的科学教育改革中,重视科学史教育已成为美国等发达国家科学教育改革的方向,强调生物科学史教学和科学本质的学习是培养学生生物学核心素养的良好途径。但学生对生物科学史的学习往往只是停留在了解水平,缺乏对科学史价值及作用的认识。生物学科学史描述科学家进行科学探究的过程和方法,蕴含了丰富的科学思想和科学探究方法等教育资源,还原科学史实验有助于学生对科学本质的理解,形成尊重科学事实的态度,养成批
本文论证了无形商品及其市场的产生和发展。在分析无形商品及其市场基本内容和基本特征的基础上,对无形商品的开发和市场的建设提出了独特的见解。
鱼腥藻7120从光转暗不同时间后,照光检测固氮活性的损失速度与氧量直接相关。在黑暗12小时后,复光时的活性恢复被氧霉素、氯化铵或38—40℃空气氧所阻遏,黑暗中生成的酶易被氧失
婚姻自由是一个历史的范畴,是社会发展到一定阶段的产物。本文在阐述民国初期婚姻自由观产生的历史条件的基础上,论述了民国时期婚姻自由观的内容和影响,以及其发展历程的曲
介绍了当前国内以压制方法生产粉末冶金零件的企业所用压力机的基本情况,粉末冶金压力机生产与开发状况,现代国外粉末冶金压力机的技术特点与最新发展,并对其进行了分析和总结。
宗族是中国乡土社会较为普遍的一种社会群体组织,可以追溯到古代的父系氏族社会、周代的宗法制度和两汉魏晋南北朝时期的门阀士族。宗族在中国社会由古代向近代转变,都产生者重
[目的]调查失能老年人长期照护家庭负担现状,探讨其影响因素。[方法]应用疾病家庭负担量表(FBS)和Katz日常生活能力指数量表(Katz-ADL)对288名失能老年人及其照顾者进行调查
宫颈癌是最常见的妇科恶性肿瘤之一,据WHO报道,在世界范围内,宫颈癌每年新发病例大约有50万例,80%的病例在发展中国家,而我国就达13.15万,约占28.8%。宫颈癌当前临床治疗中多数采用放疗