论文部分内容阅读
随着互联网技术的快速发展,电子商务已经完全融入到人们的日常生活中,消费者在无法直接了解产品时,评论就发挥了关键的作用。产品评论中隐藏着大量有价值的信息,挖掘这些评论的情感倾向既可以让消费者间接的了解到产品质量的好坏,也可以让商家通过消费者的反馈来及时调整策略。但在以往的电商评论情感分析研究中,存在着一些缺点。首先,在利用传统矩阵填充算法将电商评论转化为固定大小的文本向量矩阵时,文本向量矩阵所占存储空间较大,模型运行时间过长;其次,模型的鲁棒性较差,模型往往只在某种特定电商评论上有好的效果,而在其它电商评论中效果却很不理想;最后,在以往的传统机器学习模型和深度学习网络模型中,电商评论情感极性分析的准确率、精确率、召回率以及F1-Measure值并不理想。针对以上的缺点,本文主要研究工作如下:首先,本文在词向量训练语料库上做了改进,将维基百科中文语料库和商品评论语料库进行结合作为词向量训练的混合语料库去生成词向量库,相较于仅仅使用维基百科中文语料库,实验结果表明,混合语料库下五种电商评论情感分类的鲁棒性和准确率都有明显的提升。其次,为了解决文本向量矩阵所占存储空间过大,深度神经网络模型运行时间过长的问题,本文利用高斯分布的特性提出了两种新的矩阵填充算法,即标准长度零矩阵填充算法(ZMFtoSL)和标准长度循环矩阵填充算法(CMFtoSL),再利用深度学习神经网络对五种电商评论进行情感极性分析来证明两种新的填充算法的有效性。实验结果表明,本文提出的两种算法相较于传统的矩阵填充算法,在文本向量矩阵所占空间,模型运行时间,以及准确率上都有很好的表现。最后,本文提出了一种基于软注意力机制的MCNN-LSTM神经网络模型,该模型将多尺度卷积神经网络(MCNN)和长期短期记忆网络(LSTM)进行结合并引入软注意力机制。经实验表明,本文提出的深度神经网络模型与传统的机器学习模型,CNN和CNN-LSTM深度学习模型相比,在五种电商评论上的平均准确率提高了3.34个百分点,且具有更好的鲁棒性。模型的精确率、召回率、F1-Measure值均有明显的提升。