论文部分内容阅读
社交网络的迅猛发展为人们提供了发表和分享个人言论的广阔平台,各种网络数据迅速膨胀,越来越多的人在网络上发表意见和表达情感,潜在用户可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事物或产品的看法,因此,如何利用自然语言处理(Natural Language Processing,NLP)技术分析社交网络短文本的情感倾向,已经成为研究人员关注的热点。目前,深度学习方法已经在很多情感分析任务中取得了先进的成果,这些研究多数使用卷积神经网络(Convolutional Neural Networks,CNN)和循环神经网路(Recurrent Neural Networks,RNN),尤其是LSTM(Long Short-Term Memory)和GRU(Gated Recurrent Unit)等RNN衍生网络,不仅可以更好的解决文本序列问题,还可以一定程度上避免梯度消失,得到更好的分类效果。然而,深度学习模型通常作为“黑盒”使用,即模型只给出最后的分类结果,并未对模型的分类结果和决策做出可以理解的解释,这使得用户无法完全信任模型给出的结果从而无法帮助用户进行合理的决策。同时,研究表明在现有的情感分析模型中多数只着眼于文本上下文特征间的关系挖掘,缺乏对深层神经网络外部知识的有效整合,如情感性或常识性知识,而这些知识通常可以直接指导分类器做出决策。本文针对上述问题,提出两种基于深度学习的可解释情感分析模型:1)面向双注意力网络的特定方面可解释情感分析模型(Dual-Attention Networks for Aspect-Level Sentiment Analysis,DANSA),针对方面级情感分析任务,使用自注意力、多头注意力等机制同时获取文本的全局结构信息和特定方面相关的部分信息,一定程度上解决了CNN难以获取全局信息和RNN训练速度过慢且单词间的依赖程度随着距离增加而逐渐减弱等问题,而且模型使用多种注意力机制,能够得到每个单词对分类器决策的重要程度,从而对模型的分类结果给予解释,将DANSA在SemEval2014数据集和Twitter数据集上进行实验,与目前主流的深度学习方法相比,DANSA在通过注意力机制给出决策解释的同时获得了更好的分类效果;2)融合外部知识的可生成细粒度解释情感分析模型(A Generative Fine-Graind Explanation Model incorporating External Commonsense Knowledge for Sentiment Analysis,GECKSA),针对文档级别情感分析任务,使用Apriori算法和频率分布生成针对文本的细粒度解释,通过融合情感外部知识获取细粒度解释的情感倾向得分,然后利用该得分指导模型分类器的决策过程。将GECKSA在Amazon美食评论数据集和Booking酒店评论数据集上进行实验,与基于CNN的模型、基于LSTM的模型和基于Transformer的模型等基线方法相比,实验结果表明,GECKSA不仅可以生成合理的细粒度解释,而且通过融合外部情感常识获取解释部分的情感得分指导分类器做决策,可以得到更好的分类效果。