基于模态间语义对齐的多模态情感分析

来源 :张驰 | 被引量 : 0次 | 上传用户:et789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多模态情感分析是近年来情感分析领域中的热点方向之一,其基于文本与音视频等模态间存在着的信息互补性,通过模态间的融合来改进情感分析性能。尽管目前已经开展了很多工作,但在融合前各个模态的合适特征表示方面还研究的不够,影响了情感分析性能的进一步提高。具体表现在:当前通过简单的网络提取出的音视频特征,其语义层级与文本相比较低,导致相应的情感分析方法并没有取得理想的性能。以文本特征的语义层级为基准,通过提升音视频特征表示的层级,使其与文本特征在语义上能够对齐,是改进情感分析性能的一种有效途径方法。本文针对这一问题展开研究,分别尝试了基于音视频与文本语义表示对齐以及语义层级对齐的方法。其主要研究内容如下:1、从语义表示对齐的角度出发,对音视频模态和文本模态在语义表示上的差异进行了分析,并指出目前常用的一维卷积对齐方法无法彻底解决这一问题。为此,提出了基于分组局部向量聚合网络的模态间语义表示对齐方法。考虑到多模态情感分析任务对噪声及冗余信息比较敏感,并进而会影响性能。为此,对分组局部向量聚合网络方法进行改进,增加了用来表示噪声和冗余信息的聚类中心,并进而提出了去噪分组局部向量聚合网络的相应方法,以去除噪声或冗余信息带来的影响。2、研究如何提升音视频模态特征语义层级从而实现更准确的语义对齐。为提取音视频模态高层语义特征,首先引入Conformer网络用于音频特征提取,ViViT网络用于视频特征提取。由于Conformer网络和ViViT网络的位置编码均无法准确表示时序关系,进而影响了性能。为此,提出了基于相对位置编码Conformer的音频特征提取方法,以及基于时空位置编码ViViT的视频特征提取方法。最后通过分析不同模态特征在语义空间中的位置关系,提出了基于两段式语义空间映射的多模态融合方法,先将音视频高层语义特征结合,之后在与文本特征结合,进一步改进了多模态情感分析的性能。
其他文献
学位
果戈理的代表作《死魂灵》是一部具有深刻思想内容和鲜明批判倾向的时代巨著。它全方位揭示了帝俄黑暗腐败的社会现实,深刻剖析了当时俄罗斯社会生活的本质。文中使用了大量反映俄罗斯民族气质的文化负载词。文化负载词又称文化独特词,是语言系统中最能显露语言承载的文化信息,彰显特定民族社会历史和文化生活的词汇。鉴于译者翻译时间、翻译目的及对俄罗斯文化了解程度等方面的不同,译例特选取1935年鲁迅先生的译本、198
学位
随着工业信息化的发展,工业互联网呈现出蓬勃向上的发展趋势,极大促进了社会生产力的进步,然而其安全问题在网络攻击频发的背景下显得愈发重要。入侵检测系统是工业互联网安全防御系统的重要组成部分,通过对网络流量进行状态监测,实现对攻击流量的实时检测。本文以原始网络流量为研究对象,提出基于CNN-Transformer的入侵检测算法,对流量的时空信息进行层次化表示学习,实现了对多种攻击流量的实时高精度检测。
学位
现代工业各类电子设备测试的复杂度日益提高,伴随的是测试设备研制周期的大幅缩短,传统测试技术由于庞大的数据量、恶劣的测试环境以及设计修改的迭代过程等因素费时费力,面临日趋严重的测试困难。本课题旨在快速研制出一套通用化测试设备,为抗干扰设备的实际外场试验提供终端控制显示功能和高速数据存储功能。通过调研测试总线的发展现状,制定了基于VPX总线的测试平台方案,结合FPGA夹层板、高速串行通信、大容量固态存
学位
雷达可以探测空中的飞机、无人机等目标。在现代战争中,它在作战指挥、信息通信以及目标探测等方面发挥着至关重要的作用。随着科学技术的发展,雷达所处的应用场景越来越复杂,经常会受到周围环境杂波等因素的影响导致雷达对目标信息获取能力下降,使得雷达对目标的检测难度大大增加。因此,如何对雷达信号中的杂波信息进行有效地滤除是非常重要的;同时,雷达发射电磁波时,其探测区域内存在强散射体而导致杂波能量较强,经过滤波
学位
随着网络发展的日新月异,很多依托现代信息技术的工具正在潜移默化地影响着每个人的日常行为。在“互联网+”时代,将现代信息技术应用在教学领域势在必行。很多高校都开设了艺术设计相关专业,艺术设计专业人才的培养对提升我国整体设计水平发挥着至关重要的作用,艺术设计专业的学生由于欠缺实践经验,实践能力较弱的情况普遍存在。因此,在当前形势下,艺术设计专业领域的教学工作者应当对传统的授课方式和教学方法进行改革和创
学位
目标检测与跟踪是计算机视觉领域的研究热点,并在自动驾驶、智能监控以及体育竞技等多个领域中都发挥着关键性的作用,为人们的生活带来极大的便利。随着科学技术的不断发展,各种先进的检测与跟踪算法相继被提出。但是在实际的应用场景中,依旧受到尺度变化、背景干扰等因素带来的挑战,目标检测与跟踪仍然存在各种问题难点亟待研究和解决。本文主要研究基于视觉的游泳运动员检测与跟踪方法,具体研究内容如下:首先,针对多尺度目
学位
目的建立蕲蛇提取物中4种核苷(尿苷、尿嘧啶、黄嘌呤、次黄嘌呤)及4种氨基酸(L-羟脯氨酸、L-天冬氨酸、L-谷氨酸、甘氨酸)的超高效液相-串联质谱分析法(UPLC-MS/MS),并对蕲蛇酒浸提取物与高温水提物中核苷及氨基酸类成分的含量进行对比分析研究。方法蕲蛇提取物经甲醇-水(1∶1,V/V)超声溶解后采用HSS T3色谱柱(100 mm×2.1 mm,1.8μm)分离,以0.1%甲酸水和乙腈为流
期刊
近年来,随着智能制造的深入与机器人技术的迅猛发展,工业机器人作为一种先进、高效的自动化设备,已经被广泛的运用于工业的各个领域。但由于工业机器人本身刚度较大、自身定位精度较低,且面临的任务也越来越复杂,尤其是针对磨抛加工这类接触式作业,仅采用传统的位置控制,已经难以满足任务要求。因此,如何使工业机器人具有良好的柔顺性,且在复杂的磨抛环境中,实现精准的力跟踪控制,已成为工程中亟待解决的问题。本文以阻抗
学位
SMT(Surface Mounted Technology)工艺技术是电子制造领域中的关键技术。在传统的电子贴装生产过程中有很多亟待解决的制造问题如生产混乱、生产效能低等。在各国制造业的发展过程中,一种新的制造方式“云制造”被广泛提及。这种制造方式借助最新的信息技术如“云计算”、“云存储”等工程技术可以很好的解决SMT生产过程中所遇到的问题。本课题对A公司的生产流程和生产状况进行了考察,根据其生
学位