基于深度学习的多模态情感分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:gongshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信技术的进步以及Facebook和微信等社交平台的普及,人们在日常社交生活中会产生大量的能够代表情感的多模态数据。它已经从计算机科学传播到商业营销、金融、政治科学、健康科学甚至历史等社会科学和自然科学。文本是在进行情感分析最常用的信息,它通过单词、短语和句法关系来表达情感。然而在某些情况下,很难通过文本信息准确判断情绪。而文本和音频模态以及视频模态之间的相互作用可以提供更加丰富的信息并且获取到更多的情感特征。因为融合信息可以提供更多的情感特征,它通常会提高整体结果或决策的准确性。由于来自每种模态的序列的可变采样率而导致的固有数据不对齐,各个模态的数据通常表现出不对齐的性质。因此需要推断各个模态的长期依赖关系。深度学习是当下人工智能新兴发展的核心领域,它是在传统的机器学习领域的一次突破。在数据比较稀疏的情况下,往往能取得令人满意的结果。预训练模型的发展将自然语言处理带入了一个全新的发展阶段,利用大规模未标记语料,可以从中学习良好的表示形式,然后用于其他任务。从而进一步解决了数据集较少导致的模型过拟合的现象。本文首先介绍了对多模态数据结合深度学习算法进行特征提取的方法,统一的使用了预训练模型,参数可以根据下游任务微调,介绍了一种最新的视频语言建模模型。对于情感分析中最常见的载体文本结合融合注意力模块与图卷积网络提出了一种新的文本情感分析模型。最后在文本模态的基础上,提出本课题研究的重点基于深度学习的多模态情感分析,并且设计了俩种不同的跨模态注意力结构。相比文本模态提高了准确率,并且与其他的多模态模型进行对比,在客观上证明了方法的有效性。主要的工作包括:(1)基于深度学习进行音频、视频、文本的特征提取,统一的使用了预训练模型。对于文本模态,使用了更加稳健的Ro BERTa模型,该模型包含更多样的数据以及动态掩码策略。对于音频特征,采用了wav2vec2.0。使用掩码的策略,让模型学会恢复被掩蔽的部分,从而实现预训练的效果。对于视频模态,为了解决上下游任务域断开、文本语言缺乏联系、计算性能低下的问题,介绍了一种最新的视频语言学习表示,采用稀疏采样的策略,加入video swin transformer保持视频帧的时空信息,采用d VAE让模型学会恢复掩蔽的视频区域。并且该预训练模型支持静态图像的特征提取。本文设计了一种新的特征提取器,该特征提取器以预训练模型的最后一层作为输入,以卷积和池化交叉的方式来获取句子表示,并且增加了RELU激活函数增加非线性表达。(2)提出了一种新的结合深度学习算法的文本情感分析模型。该模型包括预训练模型、图卷积网络、融合注意力模块。通过图卷积网络动态调整预训练特征的权重,使文本情感分析在CMU-MOSI数据集准确率达到了82.9%。(3)结合基于深度学习的多模态特征提取的预训练模型,提出了一种新的多模态情感分析的方法。该模型包括跨模态注意力块、自注意力块、层归一化、图卷积网络以及残差结构,设计了俩种不同的跨模态注意力结构。实验表明该模型在数据未对齐的情况下,可以有效地关注到不同模态的交叉注意力以及远程的长期依赖。通过分析,表明跨模态相比于单独的模态可以获取到更丰富的情感信息,并且相比于其他多模态模型表现出最佳的性能,在CMU-MOSI准确率达到了83.8%。在客观上证明了该方法的可行性。
其他文献
博弈主体在不同维度上具有异质性的非对称博弈更契合现实世界的状态。因此,探索非对称博弈主体的群体合作行为演化的微观机理有着非凡的现实意义和研究价值,可以帮助理解和解决社会困境。演化博弈论作为有限理性个体通过重复博弈自适应学习以达到演化稳定策略的理论方法,为研究群体合作行为决策规律给予了强有力的支撑。本文利用演化博弈理论,结合复杂网络模型和经典的公共物品博弈模型,分别构建了个体非对称属性和道德的两种不
学位
智能家居自动化系统是指通过物联网远程监测和管理各种装置,通过布置家庭网络以及使用者的个性化要求,完成对所有家居设备的管理以及信息的反馈。物联网环境下,设备的增加使得用户经常关注这些系统执行复杂或组合任务的能力。现有的中文智能家居自动化系统只能执行一些无法满足用户需求的简单任务。由于需要学习大量的编程知识,用户很难使用可视化编程系统开发他们需要的家庭自动化系统。同时,无需用户操作的自动编程只能编写几
学位
近年来,区块链作为处理信任问题的重要技术,在金融、食品安全和交通等多个领域表现出重要的前景。共识机制作为区块链技术底层的核心部分,当前公有链使用的共识机制以工作量证明(PoW)和股权证明(PoS)为主。然而这些共识机制仍存在挑战,例如:PoW在效率与去中心化之间,以牺牲效率来获得更高的去中心化来满足公有链的根本需求,并且存在高时延低吞吐问题。PoS由于权益掌握在少数人中,所以导致了明显的中心化趋势
学位
确定药物副作用的发生频率是药物研发和药物风险-效益评估的关键问题。准确、高效地预测药物的副作用频率,对降低药物安全问题发生概率、保护患者健康有重要意义。药物的副作用频率通常在随机对照临床试验中确定,但此方法性能有限且成本昂贵。随着药物临床试验数据的增加,使得基于数据驱动的计算方法研究药物副作用成为可能。现有的药物-副作用相关预测工作主要研究药物-副作用间的关联关系。与此不同,本文旨在探究药物-副作
学位
软件缺陷对软件的质量和经济影响重大,国外研究表明,每年由于软件缺陷造成的损失就达到上百亿元。因此如何准确、高效的发现软件缺陷,减少软件缺陷带来的损失,是软件工程领域一个热门的研究方向。研究人员开始对软件缺陷的可能性、数量、严重程度、分布规律等进行预测分析,发现软件缺陷与软件开发过程中的代码度量元有关。虽然关于软件缺陷的研究从未停止,但是在实际应用中仍然面临预测结果可解释性差,难以取得开发人员的信任
学位
中小学教师职称聘后管理是教师职称制度中的重要组成部分,是职称评聘制度得以持续发挥激励作用的重要环节,对建设高质量教师队伍具有重要意义。本文把深圳市南山区公办学校教师为研究对象,使用文献法、问卷调查法等研究方法,通过查阅文献、梳理国家和地方有关聘后管理的政策现状,调查分析南山区聘后管理的实施现状,分析聘后管理的影响因素,总结南山区聘后管理存在的问题及其成因,最后提出完善聘后管理的对策。通过问卷调查,
学位
近年来,神经网络展现了强大的性能,被广泛应用到了图像识别、自然语言处理、自动驾驶等领域。然而,最近的研究表明:神经网络在面对对抗样本的表现却不尽如人意。人们提出了不同方法来减轻对抗样本带来的危害,这些方法大致可以分为三类:第一类是增强模型自身的鲁棒性,对抗训练便是其中常用的方法,此类方法需要对原有模型进行重新训练或微调,防御成本较大;第二类是在原有模型之前增加附加模块,以此去除或破坏精心设计的扰动
学位
现实世界中存在大量群体智能行为,如捕食者协同围捕、沙丁鱼洄游、无人机编队系统,这些群体智能行为是自然界和人类社会赖以生存和稳定运行的基础。如何揭示群体智能行为的涌现机理和激发机制,成为近年人工智能领域最具挑战性的科学难题之一。演化博弈论作为行为决策研究的基础理论,为定量刻画群体智能行为中个体行为决策规律、分析预测群体智能行为提供了有效的研究工具,得到了学术界的广泛研究和应用。然而,随着人工智能时代
学位
社交网络、引文网络、蛋白质交互网络等网络应用在过去十年中不断涌现并备受关注。与传统的二维数据不同,网络数据自然地表示为图。网络中除了包含节点之间成对结构关系外,每个节点又拥有自己的属性。我们称这类数据为属性图,有效的分析属性图为用户提供了对数据背后的更深层次的理解,并且在解决社区检测、企业社交网络用户分组等方面表现出极大的普及。因此挖掘属性图有重要的学术意义和应用前景。属性图聚类旨在通过充分利用节
学位
德、英、法国家先后推出工业“4.0”、工业“2050”以及“未来工业”战略计划,我国国务院也于2015年5月公布“中国制造2025”计划。反映出当前各个国家对于工业发展的重视。对于工业的发展,首先就是要发展工业智能化,也就是让机器通过人工智能、深度学习等方法帮助企业完成复杂度较高的任务、降低企业成本、提高商品质量和企业服务质量,这也是实现工业智能化的核心准则。工业智能化的发展对于企业的组织、管理、
学位