基于意见词分布的细粒度情感分析和跨模态注意力机制的反讽检测研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:linyibaby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析技术旨在挖掘数据中蕴含的人类情感,被广泛用于舆情分析、智能商业等领域。细粒度情感分析从微观角度的方面词出发,捕获句中各个方面词的情感极性,提供更加细致的情感信息。细粒度情感分析的核心在于准确提取修饰方面词的意见词,但当今的主流模型在处理复杂句式结构的上下文时,存在多方面词与其意见词难以匹配的问题。此外,当文本句中含有反讽表达时,常规的情感分析方法难以推断出正确的情感极性,而反讽检测方法能有效处理这一问题。反讽检测的关键是捕获输入数据中的不一致性。目前,结合文本、音频和视频等信息的多模态反讽检测方法逐渐成为主流,但在进行多模态信息融合时,未考虑不同模态信息在时序上的关联性存在差异。针对上述问题,本文进行了以下研究:(1)为解决复杂句式中存在多方面词与其意见词难以匹配的问题,本文提出了基于意见词分布的细粒度情感分析方法。首先,设计了意见词分布信息提取策略,即利用句法和词法信息提取目标方面词所依赖的意见词分布信息。然后,使用BERT预训练模型对上下文进行编码。并使用分布信息构建意见词分布向量,对上下文向量进行特征变换,去除上下文中无关词产生的影响,得到准确反映方面词情感倾向的特征向量。最后,将情感特征向量映射到分类空间中,对目标方面词进行情感分类。本文提出的方法,在Sem Eval 2014-2016部分数据集上进行了实验,实验结果证明了该方法的有效性。(2)针对不同模态信息在时序上的关联性存在差异的问题,本文提出了基于跨模态注意力机制的反讽检测方法。该方法采用分治策略设计了两个不同的处理模块:图文反讽模块和句内反讽模块。图文反讽模块使用情感词典和预训练模型对文本信息和视频信息进行处理与编码,获得文本情感信息和视频情感信息,加强了文本信息和视频信息在时序上的关联性。同时,提出不一致性捕获网络,捕获两种情感信息之间的不一致性。句内反讽模块通过预处理获得文本信息和音频信息的特征表达后,运用Transformer编码器实现两者的特征融合,并借助其中的深层次注意力网络学习两者之间的强关联特征,捕获文本信息内部的不一致性。最后,将两模块捕获到的不一致信息输入到预测层,实现反讽检测的准确分类。本文方法在MUSt ARD多模态数据集上进行了实验,结果证明了该方法在解决反讽检测问题上的优势。
其他文献
作为分布式控制的核心问题,多智能体系统的群集行为分析受到了广泛的关注。本文针对结构平衡的合作竞争网络,在具有Leader-following的框架下,利用合适的静态和动态的分布式事件触发控制器,探究两分一致性跟踪问题,通过设计基于个体与邻居和领导者的信息交互并且带有事件触发器的分布式控制协议,得到实现两分一致性跟踪的充分条件,具体工作如下:第一章概述目前多智能体系统的研究背景与现状,主要介绍合作竞
学位
现代信息科技的快速发展极大地促进了社会经济的发展,在丰富了人们生活同时也带来一些问题,比如怎么让大众关注文化传承?怎么积聚社会各方力量参与文化创新?本课题从文创设计协同创新的视角出发,综合设计学、管理学和社会学的交叉研究方法,通过调研与分析国内外优秀文创设计案例和社会创新经典案例,梳理归纳了国内外社会创新设计的热点和文化创意产业的特征,得出社会创新与文创设计的趋势。本文在采用文献调研法,案例分析法
学位
近年来,公共场所中由于大规模的人群活动带来的安全事故频繁发生,公共安全问题受到了社会各界的广泛关注。如何在事故发生时迅速采取应对措施或者通过预测来避免事故的发生变得极为重要。传统的疏散演习费时费力且不能真实反映出紧急情况下行人的迷茫和惊慌等情绪,而利用计算机人群仿真技术可以在有效降低成本的同时提高安全性,因此利用虚拟人群仿真技术研究人群疏散对预防安全事故发生、保障公共安全有着重大的现实意义。疏散过
学位
信息社会改变了大学生获取信息、分享、交流、应用的信息行为,同时也带来负面效应,大学生群体频频出现不礼貌、不道德乃至触犯法律的网络行为。信息伦理在伦理道德上约束人的行为,信息法律在合法性上惩罚行为主体,而信息礼仪作为引导大学生具备良好信息行为举止的重要方式却被忽略了。因此,本研究以信息礼仪提升型的APP产品为载体,引入行为设计学相关理论及激励因素,提出可行的设计方案。理论意义层面,基于定性和定量的研
学位
心肌梗塞是致死率最高的心血管疾病之一,对人们的生命健康产生了极大的威胁。因此,心肌梗塞的早期检测与诊断至关重要。心电图作为诊断心肌梗死的重要工具,具有分布广泛、成本较低、简单方便等优点。近年来随着计算机技术的蓬勃发展,基于心电信号的心肌梗塞识别领域已经成为了研究的热点,并且其具有重要的实际应用价值。因此,本文对心肌梗塞心电信号的识别进行深入研究。研究的主要内容如下:(1)针对于心肌梗塞的识别任务,
学位
生物资源是自然资源的一个重要组成部分,它不仅拥有很高的经济和生态价值,而且孕育了一批有趣也有挑战性的研究问题.生物种群作为生态学研究的一个基本对象,其种内关系也是学者们经常探讨的课题.本文从种内关系中的社会等级出发,提出了一类新的非线性离散等级结构种群模型,运用非负矩阵的特征值理论、Lyapunov函数法,以及离散系统的控制理论等数学知识对该模型进行分析,讨论了该种群个体数量的动力学演化趋势,系统
学位
本文针对对称张量,提出了一个求解其对称低秩正交逼近问题的算法.该算法结合临近技术和移位幂法,在参数选择适当的情况下,可以发现,不需有任何假设就能保证全局收敛.同时,本文根据张量的维度和阶数计算了该算法的最终收敛速率,这优于通常一阶方法的收敛速率O(1/p),最后建立了算法的线性收敛性.本文首先介绍了张量分解及其逼近问题、对称张量的低秩逼近问题的研究现状.其次,介绍了张量相关的定义以及证明收敛性所需
学位
集值微分方程作为微分方程的一个新分支,其在经济、物理等众多领域有着广泛的应用.本文主要研究某些集值微分方程的解的存在性和稳定性,运用工具是不动点理论和集值分析理论等,获得了一些有意义的成果,推广和改进了近年来发表的相关结果.本文共分为五章,第一章回顾了集值微分方程的发展历程.第二章主要介绍集值微分方程的相关概念和定理.本文的核心内容由第三章和第四章组成.第三章主要研究集值微分方程解的存在性.第一节
学位
<正>目的探讨眼科长期使用糖皮质激素的不良反应与防治、护理。方法对86例长期使用糖皮质激素的患者,进行重点观察与护理。积极预防应激性消化道溃疡,出血,感染,电解质紊乱,激素性青光眼等并发症。结果 86例患者除1例发生鹅口外,未发生其他严重不良反应。结论长期使
会议
亥姆霍兹方程(Helmholtz equation)是描述电磁波的椭圆偏微分方程,常出现在涉及同时存在空间和时间依赖的物理问题的研究中.本文利用有限元方法研究亥姆霍兹方程特征值反问题,建立关于密度函数的目标泛函.采用有限元方法离散目标函数,研究连续和离散目标函数解的存在性、稳定性、可微性以及关于特征值与特征向量的收敛性.提出了一种共轭梯度算法,并且给出了加权亥姆霍兹方程关于一维和二维特征值反问题的
学位