论文部分内容阅读
伴随互联网技术的迅猛发展,大量高效便利的社交化产品逐渐融入社会,多数行业与互联网联系愈加紧密,互联网发展日渐多元化。不同于论坛、博客等传统工具,新兴社交工具具有即时性,传播速度惊人、范围广泛,影响及改变着人们的情感判断,因此对其进行情感分析可以及时了解舆论风向,得到有用的决策信息,能对商品销售、舆论监控等提供重要支持。新兴社交工具传播的信息简短精炼,属于典型的短文本结构,口语化程度高,表述不规范,语义特征缺失,准确判断短文本的情感倾向具有挑战性。本文借助Attention机制及深度学习模型,高效的挖掘短文本的语义特征,对短文本进行情感极性分类,对评价对象进行情感倾向性识别,同时实现评价对象高效准确的提取。本文的主要研究工作包括如下几部分:(1)短文本情感极性分类。该部分结合卷积神经网络(CNN)及长短时记忆神经网络(LSTM)进行短文本情感极性判断。同时引入Self-Attention机制与Capsule网络进行深层语义的学习及特征的提取,最后基于多层次网络结构进行情感极性分类方法研究,进一步优化模型性能。(2)评价对象情感倾向性判断。该部分从文本自身及交互式信息两个角度,对文本中不同评价对象进行情感分析。首先,设计位置权重编码特征,突出更加贴近评价对象的情感特征,结合多重Attention机制实现评价对象情感倾向性判断。同时,针对交互式特征的学习,利用Scaled Dot-Product Attention,构建层次化Attention模型,更好的融合评价对象与文本上下文的交互信息,达到更优的情感分类性能。(3)基于Bert模型的评价对象抽取。本文引入Bert模型,通过深层次的学习,有效的提高了数据预处理及预训练的质量。结合双向长短时记忆神经网络(BLSTM)及条件随机场(CRF),进一步提高评价对象抽取的质量。本文基于Attention机制对短文本情感分析算法进行研究及优化,实现了短文本情感极性分类及评价对象情感识别,有效的缓解短文本信息简短精炼、特征缺失等问题,提升了情感分析模型性能。同时结合Bert模型,实现了评价对象的高效提取。