论文部分内容阅读
在线购物已成为最主流的消费方式之一,用户在电商平台发表的评论往往带有对商品的购买体验和情感观点。然而群体用户对商品评论的动态性导致情感趋势随时间发生变化,如何高效挖掘评论中潜在的情感观点,分析和预测群体用户对商品的真实情感倾向,从而辅助商家精准地定位用户需求,是促进电子商务发展的关键问题。现有情感趋势预测方法主要从单一用户角度获取情感趋势,难以深层次挖掘群体用户评论对商品的情感趋势变化,导致预测准确率低。本文从特征提取、情感分析、时序情感趋势预测三方面入手,提出一种面向群体用户的情感趋势预测方法。其主要研究工作包括以下几个方面:(1)为提高特征词提取精准度,针对传统TF-IDF算法存在的过度依赖词频计算特征词权重问题,提出一种基于多特征因素相融合的文本特征提取方法。首先,利用传统算法计算特征词权重;其次引入特征词位置和词性因子对TF-IDF算法权重进行重新分配和排序;最后融合三个结果计算更新特征词的权重。实验表明,优化后的TF-IDF算法的特征词提取精确度相对提高了1.6%。(2)为改善情感分类准确率较低问题,设计了一种基于多维情感特征向量的多层感知器(MLP)网络模型。首先,结合优化TF-IDF算法挖掘群体用户评论并获取多维情感特征;其次融合多层感知器(MLP)模型进行情感分析,以此获取群体用户情感倾向值;最后引入支持向量机(SVM)、决策树(DT)及朴素贝叶斯(NB)模型验证对比。实验表明所提出情感分类模型的准确率平均相对提高了4.9%,且F值提高了1.7%,能够为情感趋势预测阶段提供较好的基础依据。(3)在时序情感趋势预测过程,将上一阶段得到的群体用户情感倾向值与对应评论时间进行融合,构建群体用户时序情感倾向序列,并提出一种基于多层长短时记忆网络(ML-LSTM)模型的情感趋势预测方法。在大规模真实数据集上的实验效果表明,相比于现有的自回归(AR)模型、长短时记忆网络(LSTM)模型的平均MSE值分别降低了0.5%和0.02%,且ML-LSTM模型分别优于AR模型、LSTM模型的百分比达到了82.9%和13.9%,能够取得更加精准的预测结果。