论文部分内容阅读
在基于方面的情感分析(方面情感分析)算法中,深度记忆网络具有结构简单、运行速度快、自带关注机制(注意力机制)等优点。深度记忆网络的关注机制能够在一定程度上分析出上下文单词在推测评论对象情感时的重要性,但深度记忆网络的关注机制要么是基于内容的,要么是基于位置的,忽略了单词的词性。另外深度记忆网络在处理文本时,需要先将文本中的单词转化为词向量,目前主流的词向量算法C&W、Skip-Gram、CBOW和GloVe能够很好的捕获单词在上下文中的句法信息和统计信息,但无法表达单词的情感信息。虽然目前也有能够表达单词情感信息的词向量(情感词向量),但这些词向量并不完美,也无法表达单词在不同词性下的情感。为了解决这些问题,本文提出了 2种融入单词词性的关注机制和一种单词情感向量。然后将它们应用到深度记忆网络中,提出了一种单词情感向量记忆网络。最终将单词情感向量记忆网络应用到餐厅评论的情感分析中。本文研究内容可以总结如下:(1)为了提高深度记忆网络的性能,本文在深度记忆网络原有的关注机制中融入了词性信息,提出了一种基于位置、词性和内容的关注机制。另外考虑到卷积神经网络(CNN)具有很好的局部特征提取能力,本文又提出了一种基于位置、词性和内容的CNN关注机制。之后将这2种关注机制应用到深度记忆网络中,提出了 2种基于位置、词性和内容关注机制的记忆网络MN-AM-PPOSC和MN-CNNAM-PPOSC。通过在2个数据集上进行实验,结果表明本文提出的2种关注机制都能够有效的分析出上下文单词在推测评论对象情感时的重要性。和其他算法相比,MN-AM-PPOSC在2个数据集上均获得了最高的准确率。(2)为了更好的表达单词的情感,本文在TD-LSTM和SentiWordNet3.0的基础上提出了一种单词情感向量,并将其应用到MN-AM-PPOSC中,从而提出了一种单词情感向量记忆网络。通过在2个数据集上进行实验,结果表明本文提出的单词情感向量不仅能够有效的表达单词在不同词性下的情感,还能提高多个算法的准确率。和其他算法相比,单词情感向量记忆网络在2个数据集上均获得了最高的准确率。此外和SSWEh、SSWEr、SSWEu三种情感词向量相比,记忆网络等算法使用本文提出的单词情感向量能够获得更高的准确率。(3)最后本文将单词情感向量记忆网络应用到餐厅评论的情感分析中,分析并统计顾客对餐厅各个方面的好评比例和差评比例,帮助餐厅发现自身的不足并进行改进。考虑到评论中的星级信息和顾客对餐厅各个方面的情感具有一定的相关性,本文在单词情感向量记忆网络中融入了星级信息,并提出了餐厅评论情感分析模型,该模型包含方面确定、数据采集、数据预处理、融入星级信息的单词情感向量记忆网络和模型评估5个部分。实验结果表明,融入星级信息的单词情感向量记忆网络在餐厅评论的情感分析中取得了相当不错的效果,准确率达到了 98%。