基于深度学习的多模态情感识别研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:woai894781693
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着人工智能技术的不断发展,人们希望计算机能拥有人一样的情感,为人类更加便捷地服务,情感识别就是其中一项关键技术。情感识别融合了语音信号处理、心理学、模式识别、视频图像处理等多种学科,可以应用于教育、交通、医疗等各个领域。由于单模态情感识别始终存在信息利用不足、识别准确率低等缺点,所以越来越多的研究人员将重点放到多模态情感识别。但是多模态情感识别中如何提取出有判别性的特征与信息的有效交互融合是其中的关键点。本文基于人机交互中最易获取的视频数据,从中分离出文本、语音与视频模态,并结合深度学习技术进行多模态情感识别研究。并针对多模态情感识别中的特征提取、模态交互与信息融合做出了探索与改进。本文的主要研究内容如下:(1)针对文本、语音和视频三种模态数据的预处理与特征提取技术分别进行了分析、比较和研究。文本数据的预处理以及特征提取使用的是GloVe embedding预训练模型处理,其目的是为了得到尽可能多的蕴含语义和语法信息的词向量矩阵。语音数据的预处理以及特征提取采用的是Covarep特征提取工具进行特征提取,其中最为重要的特征就是MFCC特征,另外还包括其他许多有效的时域特征与频域特征。对于视频数据的预处理与特征提取,采用最为先进的Openface2.0开源工具进行处理,得到68个人脸关键点、面部形状参数、头部姿势估计、视线估计、面部行为单元和Hog等特征。然后针对多模态信息时间交互的想法,使用P2FA对齐准则进行时间维度上的对齐,以及使用Z-score标准化对数据进行再次处理,加快基于梯度下降法的收敛速度,并提升模型的精度。(2)提出了基于双重注意力机制(Double Attention Network,DAN)与门控记忆网络(Gated Memory Network,GMN)的多模态情感识别算法。首先针对多模态数据,我们使用了循环神经网络中的LSTMs编码系统,目的是为了处理三个模态的时序数据。然后,针对LSTMs编码系统,提出了改进注意力机制(Delta-Time Attention Network,DTAN),意在发现LSTM系统中不同维度的记忆信息之间的模态交叉和时间交互。接着,自然而然地提出门控记忆网络GMN对DTAN的模态、时间交互信息进行更新与保存的方法。其中,实验表明由神经网络组成的门控机制具有更强的表达能力,并有助于模型收敛。最后,使用(Global-Time Attention Network,GTAN)全局注意力机制对各个模态的不同帧进行相关性计算,以此分配大小不同的权重,促进模型聚焦于对感情识别效果更为重要的帧,并对DTAN与GMN进行信息补充,使整个模型的表达能力更强。(3)通过对单模态情感识别、双模态情感识别、消融对比实验以及多种基准方法的实验对比,进行结果验证。基于实验,分析得出双模态相较于单模态的识别效果更好,三模态相较双模态的识别效果更好,证明了额外模态的引入会显著提高情感识别精度。针对三个特有的组件DTAN、GMN以及GTAN做了消融对比实验,通过实验结果分析,得出每一个组件都对提升多模态情感识别的整体效果有明显的帮助。本论文方法在MOSI数据集上达到了 77.4%的2分类准确率,在MOSEI上达到了 83.1%的6分类准确率,达到了目前最好的识别准确率,说明了本文模型的可行性与有效性。
其他文献
国际上常用M2/GDP作为衡量一国经济货币化程度的指标,这个指标最早由麦金农提出。根据传统经济货币化的定义,货币化水平一般不能超过1。但改革开放以来,随着经济的快速发展,
首先,本文对选题背景进行了相关资料查询与调研,了解到21世纪高校进行了大规模扩招,高校学生食堂建设已经进入了新阶段。食堂中的餐厅是校园中非常重要的建筑空间之一,学生使用频率非常高,但假期闲置的时间也比较长,总计加起来有近三个月时间闲置。由于历史原因,高校学生餐厅设计有一定局限性,原来设计已经不能够满足现代高校学生及教研人员对于学生餐厅的需求。大多数高校学生餐厅功能太过于单一化,而现在学生餐厅正向着
经过多年不间断的发展,伴随着经济水平的不断提高和人民收入水平逐年上升,人们的保险意识不断增强,保险的深度和广度不断增加,中国已成为世界第二大保险市场。政府陆续出台了一系列法律和法规推动保险业规范有序发展,保险业作为社会稳压器的功能愈发突出,保险业下一步发展前景看好。我国的保险市场发展迅速,带来了发展的机遇和更多的挑战。随着外资保险公司和本土资本进入市场,保险主体逐步增多,保险业的竞争愈发激烈。同时
介绍了基于Rogowski线圈的电子式电流互感器传感头的结构、各部分的功能及其实现方法。通过理论分析和试验测试,对传感头的各种特性进行了较为深入的研究。