基于深度学习的多模态情感分析系统研究及实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：hcyzhcyz

【摘要】

：

【作者】

：

王耀平

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

情感分析是情感计算领域的主要角色,该任务主要是利用计算机来检测、分析和评估人类对不同事件、问题等兴趣产物的认知,它的应用场景在我们的生活中可以说是无处不在,在商品零售、社会舆论、金融交易等领域均能够发挥巨大的作用。传统的情感分析大多数只是基于单一模态特征来进行推理,然而在我们周围的世界中,往往包含着多种多样的模态信息,比如我们身处于一个对话场景中时,除了面对面看到对方的面部表情外,还能够听见对方说话时语气的变化,理解对方所说的语言内容等等。为了弥补单模态情感分析识别率低、鲁棒性差的缺点,人们对情感分析的研究也逐渐过渡到双模态情感分析甚至多模态情感分析。为了能够提升情感分析的准确性以及最大程度地利用到所有的场景信息,本文设计了一种能够融合语音、视频和文本三模态数据的基于深度学习的端到端多模态情感分析系统,本文的工作主要分为多模态学习算法设计和端到端系统搭建两个方面,其中多模态学习算法又可细分为三个部分,具体内容如下:（1）提出了基于不同模态输入特征的分布式特征学习网络。由于语音、视频和文本三种模态数据的内在特征的异构性,本文为了能够针对性地学习不同模态内部的潜在情感信息,在输入端为每一种模态都单独设计了一种特征学习网络,并行学习得到三种单模态情感特征向量。（2）引入了基于联合注意力的跨模态特征融合网络。在得到三种单模态情感特征向量后,本文为了实现不同模态间的信息交互,增强模态间的关联性,引入了基于联合注意力的跨模态特征融合网络,将不同模态的情感特征向量进行两两交互融合得到三种跨模态融合特征。（3）提出了基于典型相关分析的生成对抗算法。为了缩小不同模态之间的语义鸿沟,本文提出了一种基于典型相关分析的生成对抗方法,选择一种模态的情感特征作为基准,采用多任务学习的方式,优化得到最终的全局共享情感特征。（4）端到端系统搭建。本文使用Py Qt设计前端界面,分别利用麦克风和摄像头采集语音和视频数据并实时保存,同时利用科大讯飞的语音识别API实时得到文本数据,最后再将三模态数据通过已经训练好的多模态学习模型推理得到对应的情感类别并显示在界面上。基于上述设计,本文提出的多模态学习算法在IEMOCAP数据集的情感六分类任务上达到了Accuracy 64.4%,F1 Score 63.8%,相比于最好的单模态文本情感基线方法Dialogue RNN分别提升了1.8%和1.5%,相比于多模态基线模型分别提升了0.6%和0.9%。

其他文献

构造多进制LDPC码抑制OFDM峰均比的研究

正交频分复用（Orthogonal Frequency Division Multiplexing,OFDM）技术,作为无线通信中进行高速数据传输的核心技术,具有抗多径干扰能力强、频谱利用率高等多种优点。但是,OFDM系统具有高峰均功率比（Peak-to-Average Power Ratio,PAPR）的特性,当发射信号的峰值超过高功率放大器（High Power Amplifier,HPA）的

学位

基于强化学习的针对动态图链接预测的黑盒逃逸攻击

深度学习在各个领域的蓬勃发展给人类带来了巨大的利益和便利,包括图像识别、文本分类和图数据分析。但同时深度学习也存在着一定的安全隐患。有许多研究工作表明,深度神经网络（Deep Neural Networks,DNN）容易受到对抗攻击（Adversarial Attack）的影响,即恶意攻击者制造若干与正常样本差异很小的对抗样本混入到目标网络中,便能使得网络输出错误的结果。尽管有许多例如计算机视觉、

学位

新息自适应无迹卡尔曼滤波及其在组合导航中的应用

无迹卡尔曼滤波（Unscented Kalman Filter,UKF）作为一种稳定无偏且可用于非线性系统的估计方法,广泛应用于组合导航中。但是在噪声条件恶劣的情况下,噪声模型难以准确建立,导致UKF的性能严重下降,无法满足组合导航的需求。本文研究了新息自适应无迹卡尔曼滤波方法,可提升全球卫星导航系统（Global Navigation Satellite System,GNSS）和惯性导航系统（

学位

基于窄带π/2-bpsk的LPWAN通信系统信道跟踪方案设计与实现

物联网的广泛应用推动了低功耗广域网（Low Power Wide Area Network,LPWAN）技术的快速发展,LPWAN技术的低功耗和低成本特性导致通信系统中存在较大的频偏,以及终端可能存在小范围的移动导致系统出现多普勒衰落现象,频偏和多普勒衰落是影响LPWAN系统性能的主要原因之一。由于当前LPWAN技术的解决方式中存在不足,如基于扩频技术（Lo Ra）的频谱利用率不高以及基于差分相位

学位

基于多层网络的社区发现和网络节点角色划分

信息技术的快速发展为网络研究提供了新的方法,社区发现和节点角色划分作为网络研究领域两个重要的方向在近些年来逐渐被研究人员关注,它们在不同的领域有十分广泛的应用。现实世界中的网络往往是多层网络,多层网络相较于单层网络,能包含更多的信息,更大程度的反映真实的情况,本文针对多层网络社区发现和有向加权图的角色划分进行研究,主要贡献包括:1)现有关于多层网络社区发现以及节点角色划分任务的公开数据集缺少社区和

学位

5G MIMO系统下行链路调度算法设计与实现

随着移动互联网的快速发展,网络中用户数增多和服务的多样化,对网络系统中有限资源的调度分配方法提出了更高的要求。对基站的调度技术而言,如何通过更好的调度算法提升系统的整体性能,成为了第五代移动通信移动技术的重点研究内容。由于MIMO技术充分利用了空间复用增益,能够有效提升系统性能,而得到广泛应用。因此,应用MIMO技术的5G网络系统中用户调度算法的性能评估是本文的主要内容。而目前多用户传统调度算法完

学位

基于弱标记CT影像的新冠肺炎和肺动脉栓塞识别研究

采用深度学习技术进行医学影像分析是当前的热点研究问题,其研究成果将辅助医生诊断并有利于促进人类健康。针对从三维CT影像中识别新型冠状肺炎和肺动脉栓塞这两个重要问题,为减轻医学专家的手工标注工作量,本文研究了在弱标记情况下（即只给定患者级别标签）深度网络设计与训练方法。新型冠状肺炎是近年来最重大的传染性呼吸道疾病之一,在全世界范围内已造成三百多万人的死亡。在新冠疫情初期缺乏病灶标注且计算资源受限情况

学位

众包文本标注系统的设计与实现

随着信息技术的日新月异,自然语言处理在机器翻译、智能问答、文本分类等领域有着广泛的应用前景,为人们的生活带来很多便利。自然语言处理技术需要将海量的非结构化文本,加工处理成可被计算机学习和理解的数据对象。作为自然语言分析的基础,标注文本数据成为研究自然语言处理算法的一个必要步骤。本文详细介绍了一个众包文本标注系统,本系统为自然语言处理的研究人员以及文本数据标注者提供了一个语料标注的平台,满足多种标注

学位

复杂场景下步态识别研究与实现

步态识别是通过人的步态特征对行人身份进行识别,步态特征相较于其他生物特征有着明显的优势,即在远距离或低视频质量情况下的可辨别能力。由于人的走路姿态是一种长时间的行为习惯,这种习惯不容易隐藏和改变,步态特征难以伪装和模仿,可以用于行人身份的识别。近年来,随着人工智能和深度学习的发展,人们更倾向于利用人工智能技术来处理识别领域的一些问题,步态识别逐渐走进人们视野,在安防和刑侦领域都极具发展潜力。很多资

学位

基于图神经网络和强化学习的最大权重调度算法研究

近年来,随着无线通信技术的发展,越来越多基于无线网络的应用诞生。诸如无人驾驶、无人机、智能电网等物联网应用对通信带宽、时延等服务质量（Quality of Service,Qo S）指标的需要不断提高,这也使得在无线网络中,大量的基础设施需要共享有限的信道资源（如空间、频域、时域等）。因此,作为解决无线网络中资源分配问题的关键,调度一直都是无线通信中研究的核心和热点问题。本文研究的是无线调度中的经

学位

基于深度学习的多模态情感分析系统研究及实现

与本文相关的学术论文