论文部分内容阅读
特定目标情感分类(aspect-based sentiment analysis,ABSA)是情感分类领域中的一项基础任务,它的主要任务是在给定目标实体的情况下对短语或者文本进行情感分类。在早期完成此任务一般采用基于情感词典的方法及浅层机器学习的方法。近几年,随着深度学习的快速发展,大部分研究者更专注于采用深度学习的方法。基于深度学习的方法大致可以分为两步:第一步将需要分类的短语或文本转化为词向量(word vector)。第二步利用神经网络来对转化好的信息进行分类。在第一步中由于词向量的训练需要庞大的数据集,所以以往基于深度学习的方法都没有花大量的时间在训练词向量上,而是直接使用深度学习框架预训练好的词向量,但这些词向量集并不能全体覆盖都有的词语,且不同语境下的词语也会有不同的上下文关系,导致预训练词向量的鲁棒性不强。在第二步中,如何更准确的确定目标实体与情感词之间的关系,一直都是特定目标情感分类待优化的问题。此外长文本的上下文语义难以得到准确的保存问题依旧存在。为了提高预训练的鲁棒性及分类的准确性,本文做了如下的主要研究工作:首先针对预训练词向量的鲁棒性的问题,提出对预训练后的词向量进行微调的方法,将微调后的中间信息作为后续神经网络分类的原始信息。以在不同的任务数据上提高预训练词向量的鲁棒性。其次提出将目标实体与上下文分成上文、目标实体、下文三部分的形式,以减少利用注意力机制进行查询时上下文的长度,以此来优化长文本难以保存准确的上下文语意问题。后利用三部分进行交叉注意力查询,使得注意力得到跟集中的优化,从而让模型能更好的确定目标实体与情感词之间的关系,使分类准确性得到有效的提高。基于以上两点工作,本文提出了WV-LRC(left-right-center with word vector fine-tuning)特定目标情感分类模型。此外本文将WV-LRC模型在Sem Eval2014的两个数据集Laptop,Restaurant上进行了相关实验,并与其他先进模型进行了对比实验,实验结果表明,本文提出的模型在特定目标情感分类问题的准确性上确实得到了有效的提高,其最终将此模型应用在了企业舆情监测的工程应用上,同时为金融银行实现了相应的APP开发。此APP不仅减少了金融银行对互联网信息挖掘的投入,而且大大提高了互联网信息挖掘的速度,目前上线各大Android应用商店。