论文部分内容阅读
电子商务快速发展,正深刻的改变和影响着整个社会的生产和生活方式。但是电子商务产品的质量问题依旧凸显。同时随着网络交易规模扩大,随之而来的是海量产品评论,作为舆情数据的重要一种,其中包含了非常多的有价值信息。首先,消费者可以通过产品评论来了解产品的质量口碑,以作出合理的购买决策;其次,商家可以通过评论来发现产品存在的问题,及时进行改进和完善。最后,可以为质监部门掌握并解决电子商务产品质量问题提供一些参考信息。因为针对电子商务产品评论进行情感分析后,得到的结果可向消费者和商家提供有价值的决策信息,所以如何更好的完成对电子商务产品评论的情感分析具有很大的研究意义。因此,针对垃圾评论影响分析结果可信度,以及对产品特征做情感分析得到的结果具有更高价值,本文以电子商务产品评论为研究对象,在垃圾评论识别、产品特征抽取和评论文本情感分析三个方面展开研究,主要工作如下:(1)针对电子商务产品评论数据中存在垃圾评论的问题,本文提出了一种基于DBSCAN和Mean Shift的融合聚类算法。实验结果表明,通过结合后,可以有效解决Mean Shift因迭代次数多导致运行时间长和准确率受随机选择初始质心影响的问题。(2)针对LDA不能有效的从电子商务产品评论文本中抽取产品特征,本文提出AP-LDA方法,通过实验表明,改进后的算法相比传统LDA,不仅能更准确识别显性产品特征,也能有效的提取出隐性产品特征,使提取产品特征更高效与准确。(3)针对电子商务产品评论情感倾向分析问题,本文提出了Bert-Bi GRU深度学习算法,该算法使用Bert抽取文本特征,然后使用双向GRU加全连接层,并加入稀疏注意力机制,对文本的情感倾向进行判别。实验结果表明,本文提出的Bert-Bi GRU深度学习算法在针对电子商务产品评论情感分析任务上,相比传统循环神经网络模型具有更好的性能。