多人对话场景中的多模态情绪识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:toponeforever
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情绪在人类日常交流中起到非常重要作用,在对话场景中进行情绪识别的研究有巨大的商业价值和研究意义。本文利用当前比较前沿的深度学习技术,主要研究了多人对话场景中的多模态情绪识别任务。论文主要在模型性能、模型参数量和模型计算速度等方面进行研究。主要的研究内容和创新点包括以下几部分:1.在特征层面上,针对主流特征融合算法所存在的问题提出了基于情绪空间的特征融合算法。基于无监督的特征融合算法,特征维度小,可以去除数据的冗余和相互干扰,但是没办法保证转换到的空间是否跟情绪有关系。基于有监督的特征融合算法,可以显式表示交叉特征,但是特征维度高,信息高度冗余,不能解决信息相互干扰问题。本文针对有监督和无监督特征融合算法的缺点提出了基于情绪空间的特征融合算法,可以同时将多个模态的数据进行融合并且能够端到端进行学习。通过将各个模态的数据映射到维度相同的空间,并通过监督的方式将这些空间强制定义为同个情绪空间,去除了数据的冗余度。再通过权重模块去除各个模态信号之间的干扰,最后将各个模态在情绪空间的特征并联相加达到信息互补的目的。最后通过实验证明了本文所提算法的有效性,在特征维度减少的同时模型性能有所提升。2.在模型层面上,改进模型并发性的同时提出了基于多人物情绪影响的情绪识别算法。针对现有模型基于循环神经网络进行建模存在的计算速度慢问题,本文提出了基于多头自注意力机制的快速情绪识别算法。利用多头自注意力机制结构代替循环神经网络,同时对注意力机制模块中的全连接层进行了改进,将一个大的权重矩阵分解成两个小的权重矩阵,大大减少了模型的参数量。最后通过实验证明了本文提出的快速情绪识别算法在模型性能、模型参数量、模型计算速度方面上都有一定的提升。针对原有模型在建模层面没有考虑到说话者对听话者的影响和说话者上一时刻的情绪状态,本文提出了基于多人物情绪影响的情绪识别算法,增加了说话者对听话者的影响和每个人上一时刻的情绪状态。最后通过实验证明了本文提出的基于多人物情绪影响的情绪识别算法在模型性能有一定的提升,模型的F1分数达到58.43%。
其他文献
风格转换旨在保留内容图片的原始语义不变的前提条件下,利用风格图片的纹理风格对内容图进行重新的渲染。它不仅可以满足人们对美和艺术的需求,也广泛应用于艺术画作生成、视
随着新型冠状病毒肺炎的全球性的爆发,各个国家都在积极寻找治疗新型冠状肺炎的有效医疗方法,而中医和中药材在这次治疗疫情中发挥了重要作用,中药材在全世界再次得到了广泛
微结构光学薄膜具有各种形式,如裸眼3D、菲涅尔结构阵列、微球面阵列等,广泛应用于显示屏幕设备、通讯设备、新能源制造等领域,具有庞大的市场需求。光学薄膜制造的关键是在
近几十年来,人机交互与计算机视觉一直是计算机研究的一个重要领域,计算机与人之间的直接通信是人们关注的问题。人们对改善和发展人与计算机的交互作用进行了大量的研究。促
《元话语在律师提问中的作用》一文属于法庭话语探究类学术论文,从语言学的角度研究法律语境下的法律语言。该文以英国公开调查庭审期间律师提问为语料,研究其中元话语的作用,学术性较强。语言学和法学的跨学科研究使得源文词汇种类繁多、词义复杂。语言学和法律的专业背景赋予了普通词汇专业涵义,需要译者加以辨别,翻译难度大。本文重点探讨词汇翻译。笔者结合自身翻译实践,将遇到的词汇难点分为两大类,它们分别是:语言学专
随着工业社会和信息时代的高速发展,以半导体器件为基础的电子科学高速发展。其中,Si功率半导体器件以其独有的技术优势和产能优势成为当代半导体产业的中坚力量,在航空航天、军事科工、电网输运、电能机车、自动控制、物流储能等诸多方向有着广泛的应用。然而,功率半导体器件工作过程中承担巨额开关损耗并负载较大功率,极易产生温升导致一系列的可靠性风险。温度是衡量器件可靠性的重要指标,已有阿伦尼思模型等经典理论模型
随着互联网的迅猛发展,各类型文本数据剧增,给用户带来海量信息,也带来了信息过载问题,文本信息的数量已经远远超出了人工处理的极限。自动文本摘要可以通过自动地分析给定的
步态识别是生物特征识别研究方向的一个重要的分支,它是根据人走路姿势中细微的差异来对个体进行身份识别,这在安防和门禁等领域都有广泛的应用前景。相比于其它生物识别技术
随着移动互联网飞速发展,以短文本为载体的信息数据不断增加。有效信息的筛选和利用是短文本挖掘的主要目的,短文本自动分类能够帮助用户快速定位文本内容并有选择性地处理海
超可靠低时延通信(Ultra-Reliable and Low-Latency Communication,URLLC)是第五代移动通信(5G)的应用场景之一,其物理层的设计方案将直接影响低时延和高可靠指标的实现,因此