论文部分内容阅读
在线评价的文本数据中包含较为丰富的情感语义信息,可以帮助消费者了解产品信息、指导购买决策,并为商家改善各项服务提供参考。因此,准确挖掘在线评价文本中的情感语义信息具有较大的应用价值。然而,现有的文本分析方法较难充分挖掘文本中的情感语义特征和深度高层特征,会影响情感分类准确程度。为此,本文分别针对不同类型的短文本和长文本在线评价数据,提出了相应的情感分析算法,具体研究内容如下:(1)现有的短文本情感分析方法较难通过同时抽取短文本的情感特征和语义特征,改善短文本评价分类准确度。目前,基于情感词典的方法能够较为准确的提取短文本情感特征,word2vec算法能够很好的提取短文本的上下文语义特征。因此,本文提出了一种基于Sword2vec的短文本评价情感分析算法,能同时提取到短文本评价的语义特征和情感特征。该算法首先利用情感词典的方法提取短文本的情感特征,用word2vec算法提取短文本的语义特征;其次,利用情感特征对语义特征进行加权,得到文本的情感语义特征Sword2vec;最后,利用Sword2vec特征训练得到的模型对评价文本进行分类识别。实验结果表明,该算法相对于现有传统方法,在准确度和执行效率方面均有提升。(2)相较于短文本类型的在线评价数据,长文本类型的在线评价情感分析问题更为复杂。现有的长文本情感分析方法较难同时提取长文本评价数据的远近上下文语义信息、深度高层信息和情感信息,较难准确地刻画长文本的复杂特征。为此,本文提出了一种基于AttBiLSTM_Sword2vec的长文本评价情感分析算法。首先,利用情感值加权word2vec词向量得到情感特征和较近语义特征Sword2vec,并用基于注意力的双向长短期记忆力神经网络得到评价语料的深度特征和较远语义特征AttBiLSTM;其次,将Sword2vec特征和AttBiLSTM特征进行融合得到AttBiLSTM_Sword2vec特征;最后,利用AttBiLSTM_Sword2vec特征训练得到的模型对评价文本进行分类识别。实验结果表明,该算法能够同时提取并融合长文本评价的远近上下文语义信息、深度信息和情感信息,进而改善针对长文本评价的情感分析效果。