基于多模态信息融合的情感识别研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:vivi8133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感识别研究是实现情感智能的关键方法之一,涉及到包括生理学、心理学、认知科学等在内的诸多领域,是一个多学科交叉的热点研究课题。由于单一模态(如语音、图像、文本等)的情感识别受到单一情感特征的限制,情感识别识别率有待提高。近年来,有学者提出基于多模态融合信息进行情感识别的方法,使得情感识别的准确率得到了较大提升。
  本论文提出一种融合情感语音、面部表情和情感文本的情感识别方法,并采用基于特征层融合与决策层融合两种策略进行多模态融合。采用中国科学院自动化研究所建立的CHEAVD2.0数据集,包含生气、悲伤、高兴、焦虑、惊讶、厌恶、担心和中性等八种情感类型,共计5624个多模态对应文件。
  本文的具体研究工作包括以下内容:
  (1)语音情感识别研究。本文首先基于梅尔频率倒谱系数的音频词袋特征选取语音情感特征;然后,将原有的包含多帧数据特征的梅尔频率倒谱系数向量转换成维度固定的句子级别的特征向量;最后,以这些句级特征向量作为语音情感特征的数据来进行情感识别。
  (2)人脸表情识别研究。本文首先对数据集中的视频文件进行分帧和人脸检测,得到面部表情数据;然后,设计一个六层的卷积神经网络进行表情分类;随后,为了进一步提高表情识别的准确率,采用对VGG16网络进行二次微调的方法进行实验;最后,对比两个模型的分类性能,选择其中识别准确率更高的模型,将其全连接层的输出作为人脸表情特征,用于特征层融合实验,预测结果用于决策层融合实验。
  (3)文本情感识别研究。本文首先采用语音识别工具提取出所用数据集的语音文本内容;然后,对得到的文本数据去标点符号、分词、去停用词等预处理,获得词汇文本数据,同时,采用中文维基百科语料基于skip-gram模型训练出词向量模型,并用该词向量模型将预处理后的词汇文本数据映射为词向量;随后,采用常用的暴力平均法获得句子级别的特征向量,进行文本情感识别,最后,为了提高文本情感识别准确率,本文提出基于循环神经网络的文本情感识别方法,用动态循环神经网络学习句子中所有词汇的序列关系,得到句子级别的特征向量,用于文本情感识别。
  (4)多模态情感识别研究。本文提出一种基于二次训练的决策层融合方法,基本思想是通过训练来拟合单模态决策结果与样本标签之间的映射关系。与特征层融合方法以及传统的六种决策层融合规则进行了对比实验。
  实验结果表明,多模态情感识别的准确率高于单模态情感识别,而在两种融合策略中,本文所提出的基于二次训练的决策层融合方法获得了更高的识别准确率。
其他文献
近年来,基于多项式模糊模型的方法由于其对非线性系统的建模能力受到了广泛的关注。目前基于多项式模糊系统的稳定性分析和控制器综合逐渐完善,但是对于连续多项式模糊时滞系统在控制器设计方面还有一些限制。此外,随着人类对控制理论的深入研究,大型的非线性系统如航空发动机,核工程等虽然为我们生活提供了便利,但是一旦发生故障,将会带来灾难性的后果。因此,对基于多项式模糊模型的非线性系统容错控制与故障检测研究具有非
随着科技发展和人民生活水平的快速提高,服务机器人越来越受到人们的欢迎。对于家庭服务、仓储物流、养老助残等服务机器人而言,配备多自由度机械臂并具备物体抓取功能,已经成为标准的功能配置之一。然而,与工业生产线上机械臂的重复抓取动作不同,服务机器人实现物体抓取的关键问题之一是正确识别物体并进行位姿估计。本文研究多自由度机械臂抓取的物体识别与定位,对于保障服务机器人的准确动作具有积极的意义和工程价值。  
小型无人机作为复杂环境下执行任务的最佳平台之一,能够在没有人的直接干预下执行多种多样的任务,极大地扩展人的视野,起到辅助决策的作用。基于图像的目标自动识别与检测技术是现阶段无人机视觉导航领域急需解决的重要问题。本文以四旋翼无人机执行伴随飞行任务为背景,主要讨论了基于的视觉的目标识别与检测的问题,给出了一种基于双目视觉的无人机伴随飞行目标检测算法。  本文从四旋翼无人机工作原理出发,针对现阶段研究中
学位
随着计算机视觉和深度学习的发展,基于计算机视觉的视障人士辅助系统开始萌芽。目前,基于深度学习的目标检测算法已经取得了巨大成就,但其依赖GPU的强大计算能力,无法独立地在硬件性能受限的视障人士辅助系统中应用。针对计算能力与检测效果之间的矛盾,本文提出了基于云平台的室内环境目标检测系统,通过智能终端与云平台相互协作的方式完成高性能的目标检测系统,具有很强的理论与现实意义。  本文所设计的基于云平台的室
学位
随着计算机视觉、模式识别等领域的快速发展,人脸表情识别技术已经成为当今研究热点。与以往基于静态图像不同,基于视频提取出的表情特征同时包含静态和动态信息,静态信息主要体现在从每幅图像中提取表情特征,而动态信息则体现了多帧图像集合而成的整体表情的变化过程。此外,近几年深度学习在许多应用中的性能表现超越了传统的机器学习方法,如何运用深度学习提高表情识别率成为了一个重要的研究方向。  本论文的主要研究内容
学位
实现并验证控制算法是控制教学实验系统的基本功能。随着网络和通信技术的发展,基于本地操作的教学实验系统逐渐向远程化方向发展,从而摆脱了地理位置的限制,使随时随地通过物理实验验证控制算法成为可能。尽管如此,如何根据控制研究与教学的需求,将控制技术与最新的信息技术相结合,进一步扩充现有系统的功能是控制教学实验系统开发者所持续面临的问题。  在过程控制教学实验中,双容水箱是广泛应用的典型过程控制教学实验对
学位
随着近些年习总书记提出的“智能制造”,中国的工业水平得到了飞速的发展,随之而来工业以太网也得到了巨大的发展,工业网络对流量的需求以及规模的要求也越来越高,这导致了网络拥塞现象的频发。网络拥塞的存在制约着以太网的发展和应用,采取有效的方法来预防和控制网络拥塞的发生显得极其重要。近年来,针对传统优化与控制算法的不之处,国内外的学者将先进控制技术、非线性控制理论、智能优化算法等应用到网络拥塞控制当中,取
学位
随着科学技术的不断发展,企业间的竞争开始从实际生产领域向非生产领域延伸,物流作业是企业生产流程中的重要环节,物流运输车辆的管理与企业生产效率密切相关。对于大型生产制造类企业,物流车辆的管理问题逐渐突显出来。内外部物流配送车辆众多、车场分布杂散以及对车辆的不可控制,导致无法做到对车辆的充分监控和管理。物流配送路线的不合理安排,造成厂区内车辆堵塞和滞留的情况时有发生。这些问题不仅给企业生产安全带来隐患
油田测控是油田自动化生产中的重要环节,近年来随着计算机技术、网络技术的发展,油田测控系统逐渐朝无线化、网络化、智能化发展。对原有的油田测控系统进行改造可以极大地提高油田开采测控的实时性和油田生产的安全性,同时也能降低人员成本,提高生产的效率。  现有大多数油田无线测控系统目前使用ZigBee技术组建MESH网络。但是,这种网络由于跳数较多,且需要经历发现路由、寻找路由等复杂的网络过程,用于网络同步
近些年来,随着经济的发展和贸易量的增长,集装箱运输重要性逐步显现。很多学者针对集装箱运输这一领域展开了研究。集装箱接驳运输是集装箱运输问题中一个重要分类。  其中,在集装箱接驳运输问题上,很多学者提出了一些新的优化算法。针对同一类问题,新的算法的求解结果需要与已有算法的结果进行比较,证明新算法的有效性。为了便于从事相关问题研究的科研人员进行算法对比,所以设计并实现了集装箱建模与优化实验平台。使用该