基于语音和人脸表情的多模态情感识别算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:nbywfcom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然人机交互技术是当前计算机应用技术研究的重要方向,情感的自动识别是实现自然人机交互的关键技术之一。考虑到卷积神经网络可以同时进行图像特征提取和模式分类,且局部连接和权值共享这两大机制可以减少训练参数,因此,在对卷积神经网络理论进行深入研究的基础上,为避免传统方法中特征提取等复杂过程,本文将卷积神经网络应用于情感识别领域。本文基于卷积神经网络提出一种新的可以分别用于语音情感识别和人脸表情识别的算法,然后提出一种多模态融合的情感识别算法。本文主要研究内容如下:(1)卷积神经网络理论的研究。分析了卷积神经网络的基本原理及参数学习算法,为本文将卷积神经网络与情感识别相结合提供理论基础。(2)提出一种新的基于声谱图和卷积神经网络的语音情感识别的算法。由于声谱图是能够反映语音时频特征的二维图像,为了解决传统识别算法中特征提取复杂以及特征质量不佳等问题,提出将声谱图作为卷积神经网络的输入数据。利用卷积神经网络对声谱图特征进行自动学习,实现对声谱图端到端的处理,进行有监督学习和训练以得到相应的网络模型。通过在CASIA汉语情感语料库和德国柏林语料库上分别进行实验,对应的语音情感识别率分别可达到79.6%和77.8%,表明该算法的可行性。(3)提出一种融合语音和人脸表情的情感识别算法。由于人类情感的表达是通过多种形式同时进行的,单一形式的情感识别具有一定的局限性,故本文利用不同模态之间的互补性,提出一种基于语音和人脸表情进行多模态情感识别的算法。即利用卷积神经网络自动学习人脸表情和声谱图的特征,用经过训练的网络模型对测试样本进行识别,得到相应的识别结果,然后进行决策级融合求其最终识别结果。在e NTERFACE’05音视频多模态情感数据库上进行融合实验,识别结果最优可达84.8%,识别系统的整体性能得到一定改善。
其他文献
在农业生产保障上,水利工程发挥了巨大作用,其在改进区域经济发展质量的同时,也能够有效防止农田遭受旱涝灾害。为使水利工程充分发挥其抗旱防涝功能属性,应将水利工程建设质
<正>希尔顿的成功是一种商业传奇,从亲切的微笑中体会到见微知著的企业文化力量,宾至如归是希尔顿的精神所在,也是每一个旅行者的人心所向,企业在做到把握顾客内心真实需求的
本文通过对动拆迁信访矛盾的客观因素及主观因素的分析,得出动拆迁中的几种主要信访矛盾,有针对性提出了化解动拆迁矛盾的对策与建议。
神谕与预言是古希腊宗教的一个重要组成部分。古希腊人经常就现实生活中困扰他们的各种问题请求神谕或寻找预示。在古希腊城邦政治生活中,神谕与预言是一种极为有力的影响公
地方经济发展离不开水利工程建设,因此,做好基层水利的管理工作至关重要。本文就基层水利管理工作存在的问题进行探讨,分别从体制、管理执行力和基础设施建设3个方面分析了现
随着航标信息化的不断推进,航标应用数据正以前所未有的速度增长,长期的航标业务数据的积累预示着航保大数据时代即将到来。通过对航标大数据内涵和外延的深入理解,本文研究
介绍了ASP的概念、内涵、运作模式以及特点,阐述了基于Web和COM技术的轨道式球阀设计系统的网络体系结构、总体结构设计以及系统的实现,采用VBScript代码调用COM组件的方法实
《红楼梦》继承和发展了《牡丹亭》中的女性意识。在女性主体意识方面,《牡丹亭》主要表现在追求个人爱情,而《红楼梦》不仅仅表现在对爱情的追求和歌颂,更表现在对女性自身
在新时期我国电视剧的艺术研究中,"审美现代性"是一个重要的议题。其中,现代性体验是审美现代性研究的逻辑起点;"春天中国"是现代性体验的中心幻象;"憧憬型"、"感愤型"、"回
随着互联网技术的快速发展,网络中的数据正在以我们无法想象地速度产生,信息过载现象日益严重,为了信息被更加高效地发掘和利用,个性化推荐技术被提出,并且得到了广泛研究和