基于音视频的维度情感识别技术研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:q396782458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,情感识别成为了人机交互领域的研究热点问题,通过人类情感表达时所产生的行为、生理和心理反应去量化、描述和识别不同的情感状态,根据情感表示模型利用音视频模态信息构建情感识别模型。情感是时序变化的,也是通过音视频模态进行表达的,在单模态情感识别虽然有了一定的研究成果,但音视频模态维度情感识别能够检测出细微情感变化,得到了越来越多的关注。而音视频模态维度情感识别中需要考虑如何进行不同模态情感信息的有效融合。本文分别从单模态维度情感识别、基于BLSTM模型的维度情感识别、基于Transformer模型的维度情感识别等方面对情感识别方法进行了改进,并在此基础上研发了情感识别系统。主要研究工作如下:(1)在单模态维度情感识别方面,为了探究有效的情感特征和情感识别模型,解决不同模态情感特征的性能差异问题,本文提取了音频、视频和文本多种情感特征,并在多种情感识别模型中进行了大量实验,对情感特征和识别模型的性能进行了对比,为多模态维度情感识别实验中的特征选择和基础模型选择打下了基础。(2)为了提高情感识别性能,解决小数据集和数据标签不匹配的问题,本文提出了情感数据集的数据增广和数据标签延迟优化方法,构建了改进的双向长短时记忆网络(Bi-directional Long Short Term Memory,BLSTM)模型特征层融合维度情感识别模型,对情感识别性能有了较大的提升。然后,针对特征层融合存在不同模态之间的同步问题,又构建了改进的BLSTM模型决策层融合维度情感识别模型,该方法可以在不同时刻从耦合的模态中提取更有效的情感特征,对情感识别性能提升取得了更好的效果。(3)为了解决在BLSTM模型中存在的多模态信息流同步和不同模态信息关联的问题,本文基于多头注意力机制(Multi-Head Attention)构建了基于Transformer模型的深层特征学习,并分别在特征层、决策层、模型层维度情感识别中做了探究实验,结果表明Transformer模型可以有效提高情感识别性能。本文所提方法相比于不同基线方法在激活度和愉悦度上均取得了最佳的性能,可以在高层维度对情感信息有效捕捉,进而更好的对音视频信息进行有效融合。此外,为了便于观察在不同测试视频中情感识别的效果,研发了基于音视频的情感识别系统,能够更加直观的展现实验结果。
其他文献
近年来,不同发展阶段的目标检测算法层出不穷,不少学者越来越关注目标检测算法面向工业界的应用,尤其是算法对实际场景是否有足够的鲁棒性。遥感图像是航空器或航天器在高空采集的俯瞰航拍图像集,对地球资源调查与开发、国土整治、环境监测、以及全球性研究有着重要的实用性价值。遥感图像的目标检测对于计算机视觉和数字图像处理方向的很多任务都有很重要的应用价值,因此具有很高的研究意义。随着人工智能技术的迅速发展,基于
学位
通过运行序批式生物反应器与摇瓶实验相结合方法,在进水中投加不同数量Ca2+(0~200mg/L),考察了Ca2+在好氧颗粒污泥形成中的作用.当SBRⅠ、Ⅱ进水Ca2+含量分别为30、100mg/L,运行20d后,两反应器中均出现了好氧颗粒污泥.运行前50d,SBRⅠ中颗粒污泥浓度MLSS与污泥沉降指数SVI指标明显好于SBRⅡ;运行80d后,SBRⅠ、Ⅱ中污泥浓度MLSS均稳定在7.5g/L,SV
期刊
人脸表情迁移是计算机图形学角色动画领域的一项关键技术,可应用在电影制作、人机交互、虚拟现实等诸多领域。随着深度学习的发展,人脸表情迁移的深度生成模型替代了传统计算机图形学方法,提高了泛化能力。同时,基于生成对抗网络(Generative Adversarial Network,GAN)的人脸表情迁移为生成清晰的人脸表情图像提供了生成器与判别器博弈对抗生成的新思路。本文通过对生成对抗网络及其相关理论
学位
现实工程应用中常受数据采集设备、成本等的制约,导致数据集正负样本比例失衡,由此引发后续分类识别准确率低等问题。在众多解决方法中,最简易有效的是通过数据生成方法平衡正负样本比例。目前不平衡学习多集中于处理二分类失衡数据,但实际样本数据常具有多属性多类别的特点,因此,研究多类别不平衡学习问题具有实际应用价值。之前的研究工作中,多类别失衡数据生成过程的设计都是基于样本整体分布,而未考虑多类别失衡数据集中
学位
涉及计算机程序的发明在满足构成技术方案、具备实用性或其他条件下能授予专利权已逐渐成为共识。当下,如何为涉及计算机程序的发明提供更适宜的保护规则以实现制度目的、适应行业发展及满足发明人的权益保护需求成为新的重点问题。本文第一部分主要从涉及计算机程序的发明的概念、可专利性审查标准和权利要求撰写类型演变三方面对涉及计算机程序的发明进行基本介绍。第二部分主要从立法和司法两方面介绍我国涉及计算机程序的发明专
学位
报纸
准确客观地衡量科研学者的学术水平是一项至关重要的任务,目前各种基于图的排名算法如Page Rank算法等,已经被广泛应用在同构网络中,针对单一类型实体进行排名,但不适用于异构网络。虽然科学排名算法发展迅速,但仍有一些问题值得进一步研究。第一个问题,传统的算法都是应用于同构网络中,可是新的研究已经证明,使用混合或异构网络的排名效率更高。第二个问题,以往的研究只考虑了研究者的平均绩效,而忽略了研究者的
学位
无重叠的序列模式挖掘是序列模式挖掘的一种重要挖掘方法,不仅能够灵活地表达用户的需求,而且满足Apriori性质,运用该性质还能够避免很多无效的计算,从而提高挖掘的性能。然而现有的算法并没有考虑用户感兴趣的属性,导致挖掘结果中包含了大量用户并不关注的频繁模式。为了解决这一问题,本文研究了无重叠的三支序列模式(Nonoverlapping three-way sequential pattern,NT
学位
遥感图像技术的发展促进了农业生产、预防自然灾害和军事预警等众多行业的发展。遥感图像目标检测是遥感图像解译的重要任务之一,是指在图像中准确地找到某类目标的位置。其输入为一幅遥感图像,输出为被检测目标的类别信息和坐标信息。遥感图像的尺寸往往是巨大的并且需要极高的检测响应速度。随着大规模的集成运算群的发展,使用先进的计算机技术处理遥感图像成为完成遥感目标检测任务的必要方法,故而针对遥感图像的目标检测算法
学位
近年来,随着专利数量的日益庞杂,从海量专利中获取有效信息已愈发困难,在此背景下,用于挖掘有效信息的推荐算法已逐渐应用到专利领域中。然而,作为推荐算法中的关键技术,文本聚类算法在推荐系统的应用过程中存在一定不足。首先,作为聚类算法的输入表征,功效特征在专利中十分重要,如何精确提取专利中的功效信息是目前面临的挑战。其次,在专利聚类分析方面,基于IPC分类分析的方法是粗粒度的,无法与专利内容紧密结合,不
学位