论文部分内容阅读
随着电商行业的兴起和互联网的快速发展,网购在生活中的占比越来越高,在方便消费者购物的同时,也让人们对商品的品牌品质产生了更高的追求。基于电商平台的载体,一种以评论为导向的消费方式逐步在市场上扩充开来。消费者购买商品时,常常会参考该商品相关的评论,从而可能影响或调整自己的购买意愿;评论对于商家来说也能了解到消费者的情感倾向,可以辅助商家进行舆情分析、产品优化、用户画像和营销决策等,提高经济效益。但是面对快速增长的数据,不能也不必采用低效率的人工处理的方式,需要的是开发出能自动化分析商品评论情感倾向的工具,从海量的评论中挖掘出有价值的商品属性和情感倾向,既帮助消费者更好地选购商品,也有效辅助商家更好地了解消费者的观点。本文将从以下两个方面进行研究:粗粒度的手机评论情感分析和细粒度的手机评论属性情感分析。粗粒度主要是判断评论整体的情感倾向,是偏向积极还是消极;细粒度主要是挖掘手机评论中的属性特征和对应的消费者观点,并确认其情感极性和属性种类,将其归到对应的主题中。具体研究成果如下:(1)粗粒度的情感分析采用引入注意力机制的深度学习算法。针对已有算法存在前后句对间没有联系、训练顺序只能是时间顺序的缺点,在模型中引入了注意力机制。本文采用了GRU和双向LSTM的改进版,克服了原有算法的缺点,并与基础算法进行对比分析,还采用了效果较好的Transformer模型。实验结果表明:原有的LSTM模型的准确率较低为59%,GRU的准确率与LSTM模型相差不大,Transformer模型的准确率能达到96%,而经过改进的GRU和双向LSTM的准确率能够达到97%,比单一模型的准确率有较大提升,同时也证明了注意力机制的有效性。(2)细粒度的情感分析采用基于word2vec的主题聚类的方法。针对现有常见的主题聚类模型存在的问题,本文先利用哈工大LTP对评论作预处理,从评论数据中找到手机属性作为主题中心词;然后用word2vec对主题进行聚类并建立主题属性字典,将属性归类到相应的主题中;接下来利用SnowNLP计算每个主题下的每条评论的情感值并根据相应的阈值划分积极、中性和消极三类情感;最后将不同品牌的属性情感分析对比情况以及某一品牌的评论情感得分以可视化的形式展现出来,达到对不同品牌相同属性和同一品牌不同属性进行对比分析的目的。结果表明:对于不同品牌相同属性,可以明确各个品牌手机的优劣势,消费者能选择更合适的品牌;对于同一品牌不同属性,可以量化各个属性的被关注程度和消费者的情感程度,帮助消费者更全面具体地了解品牌,同时商家也能对其商品进行优化,带来更大的收益。