一种融合视觉和听觉信息的双模态情感识别算法

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:fxmen2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号和面部表情是人们表达情感的主要途径,也被认为是情感表达的两个主要模态,即听觉模态和视觉模态.目前情感识别的研究方法大多依赖单模态信息,但是单模态情感识别存在信息不全面、容易受噪声干扰等缺点.针对这些问题,提出一种融合听觉模态和视觉模态信息的两模态情感识别方法.首先利用卷积神经网络和预先训练好的面部表情模型,分别从语音信号和视觉信号中提取相应的声音特征和视觉特征;然后将提取的两类特征进行信息融合和压缩,充分挖掘模态间的相关信息;最后,利用长短期记忆循环神经网络对融合后的听觉视觉双模态特征进行情感识别
其他文献
实施工学结合人才培养模式需要学校和企业两种教育资源。建设一支高质量的"双师型"教师队伍,是有效实施工学结合人才培养模式根本保证。"双师型"教师队伍建设包括专任教师的双师
小学班主任对于德育工作开展的情况并不是非常的乐观。一部分原因是班主任对学生德育素质的认识不是非常的全面,他们没有意识到德育本身的重要性。也受到了家长对于成绩的不
简要介绍地铁车站的排水种类和方式,重点探讨排水地漏的布置,以及地铁车站废水泵站和污水泵站的设计及控制方式等问题,供设计人员参考。