论文部分内容阅读
随着信息技术的蒸蒸日上,互联网特别是其中的移动互联网日益成为人民群众生活中至关重要的一部分。人们越来越热衷于在各种网站上和移动应用中发表自己的评论,面对这些迅猛增长的文本评论数据,怎样更好的理解这些数据,更加迅速有效的挖掘这些数据背后蕴藏的情感信息,显得越来越重要。情感分析(Sentiment Analysis)技术的出现正是为了针对这些问题。方面级别情感分析(Aspect-level Sentiment Analysis)是情感分析技术的一个重要子任务,是一个十分具有挑战性的问题,其任务目的是自动预测同一个句子中各个不同方面的情感极性。方面级别情感分析相比传统句子级别情感分析能够给出更详细、更具体的结果,在电商平台等应用领域内具有十分广阔的潜在应用前景。因此,方面级别情感分析技术得到了学术界和企业界的广泛关注,这些年来成为了一个热门的研究课题。近年来,传统的句子级别情感分析研究已经取得了很不错的成果,在实际生活中也得到了广泛应用。然而,传统句子级别所用的研究方法在针对更细粒度的方面级别情感分析时性能一直不高,因此方面级别情感分析研究中仍然存在许多亟待解决的问题。本论文针对面向评论文本的方面级别情感分析技术进行研究,研究成果主要有:一、针对深度神经网络中存在的不可解释性问题以及现实生活中丰富的语言学资源(语法规则等等)未得到利用的问题,提出将卷积神经网络(CNNs,Convolutional Neural Networks)与语言学资源相融合的方法。具体地,首先将输入的评论语句表示为向量形式,同时将句子的方面信息也表示为向量形式,然后把这两种形式的向量拼接起来组合成输入向量输入到卷积神经网络。最后将语言学规则建模成正则化项加入到卷积神经网络中。最终实验结果表明,与基线系统相比,该方法在方面级别情感分析任务上性能有较大提升,同时改善了模型的可解释性。二、针对评论语句中各个方面的情感信息没有得到较好利用这一问题,在用卷积神经网络作为基本网络架构的基础上又加入了门控机制(Gating Mechanism)来更好的选择输出的情感特征。此外,对语言学资源进行了更深入的研究,提出新的语言学正则项加入到卷积神经网络中。实验结果表明,门控机制能有效地利用句子中的方面情感信息,同时,新提出的语言学正则项效果明显。整个系统相比基线系统,能取得更好的效果。