基于深度学习的可解释性情感分析模型研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户：lightingguo

【摘要】

：

【作者】

：

孙小婉

【出处】

：

吉林大学

【发表日期】

：

2020年08期

【关键词】

：

情感分析多头注意力自注意力可解释性情感分析外部知识融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

社交网络的迅猛发展为人们提供了发表和分享个人言论的广阔平台,各种网络数据迅速膨胀,越来越多的人在网络上发表意见和表达情感,潜在用户可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事物或产品的看法,因此,如何利用自然语言处理(Natural Language Processing,NLP)技术分析社交网络短文本的情感倾向,已经成为研究人员关注的热点。目前,深度学习方法已经在很多情感分析任务中取得了先进的成果,这些研究多数使用卷积神经网络(Convolutional Neural Networks,CNN)和循环神经网路(Recurrent Neural Networks,RNN),尤其是LSTM(Long Short-Term Memory)和GRU(Gated Recurrent Unit)等RNN衍生网络,不仅可以更好的解决文本序列问题,还可以一定程度上避免梯度消失,得到更好的分类效果。然而,深度学习模型通常作为“黑盒”使用,即模型只给出最后的分类结果,并未对模型的分类结果和决策做出可以理解的解释,这使得用户无法完全信任模型给出的结果从而无法帮助用户进行合理的决策。同时,研究表明在现有的情感分析模型中多数只着眼于文本上下文特征间的关系挖掘,缺乏对深层神经网络外部知识的有效整合,如情感性或常识性知识,而这些知识通常可以直接指导分类器做出决策。本文针对上述问题,提出两种基于深度学习的可解释情感分析模型:1)面向双注意力网络的特定方面可解释情感分析模型(Dual-Attention Networks for Aspect-Level Sentiment Analysis,DANSA),针对方面级情感分析任务,使用自注意力、多头注意力等机制同时获取文本的全局结构信息和特定方面相关的部分信息,一定程度上解决了CNN难以获取全局信息和RNN训练速度过慢且单词间的依赖程度随着距离增加而逐渐减弱等问题,而且模型使用多种注意力机制,能够得到每个单词对分类器决策的重要程度,从而对模型的分类结果给予解释,将DANSA在SemEval2014数据集和Twitter数据集上进行实验,与目前主流的深度学习方法相比,DANSA在通过注意力机制给出决策解释的同时获得了更好的分类效果;2)融合外部知识的可生成细粒度解释情感分析模型(A Generative Fine-Graind Explanation Model incorporating External Commonsense Knowledge for Sentiment Analysis,GECKSA),针对文档级别情感分析任务,使用Apriori算法和频率分布生成针对文本的细粒度解释,通过融合情感外部知识获取细粒度解释的情感倾向得分,然后利用该得分指导模型分类器的决策过程。将GECKSA在Amazon美食评论数据集和Booking酒店评论数据集上进行实验,与基于CNN的模型、基于LSTM的模型和基于Transformer的模型等基线方法相比,实验结果表明,GECKSA不仅可以生成合理的细粒度解释,而且通过融合外部情感常识获取解释部分的情感得分指导分类器做决策,可以得到更好的分类效果。

其他文献

利用六西格玛工具降低球团矿FeO含量的技术实践

本文首先对链篦机-回转窑球团生产工艺进行了详细的介绍,为提高球团矿质量引出了FeO含量对球团矿质量的影响;其次,简单的介绍了六西格玛管理的起源与发展以及推崇企业效率与客户双赢的核心理念;再次,阐述了包钢固阳球团矿FeO含量的现状及采取措施与取得成效;最后,为进一步降低FeO含量,将先进的六西格玛方法导入,选用DMAIC模型一步步详细阐述了六西格玛管理的五个阶段—项目界定、测量、分析、改进和控制在球

学位

回转窑球团矿minitabFeO含量六西格玛管理

富β体杀灭菊酯分离技术的试验

探索了富β体杀灭菊酯原油的分离技术，并从对分离影响较大的分离配比和温度两个因素中找到较佳分离方法以达到理想的分离效果。

期刊

富β体杀菊酯分离杀虫剂农药rich β-fenval erateseparation

广东省“三苯”生产状况与发展预测

介绍广东省苯、甲苯、二甲苯的生产现状、进口与消费,并对今后的发展予以预测.

期刊