面向群体用户的情感趋势预测方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:lxlhenhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线购物已成为最主流的消费方式之一,用户在电商平台发表的评论往往带有对商品的购买体验和情感观点。然而群体用户对商品评论的动态性导致情感趋势随时间发生变化,如何高效挖掘评论中潜在的情感观点,分析和预测群体用户对商品的真实情感倾向,从而辅助商家精准地定位用户需求,是促进电子商务发展的关键问题。现有情感趋势预测方法主要从单一用户角度获取情感趋势,难以深层次挖掘群体用户评论对商品的情感趋势变化,导致预测准确率低。本文从特征提取、情感分析、时序情感趋势预测三方面入手,提出一种面向群体用户的情感趋势预测方法。其主要研究工作包括以下几个方面:(1)为提高特征词提取精准度,针对传统TF-IDF算法存在的过度依赖词频计算特征词权重问题,提出一种基于多特征因素相融合的文本特征提取方法。首先,利用传统算法计算特征词权重;其次引入特征词位置和词性因子对TF-IDF算法权重进行重新分配和排序;最后融合三个结果计算更新特征词的权重。实验表明,优化后的TF-IDF算法的特征词提取精确度相对提高了1.6%。(2)为改善情感分类准确率较低问题,设计了一种基于多维情感特征向量的多层感知器(MLP)网络模型。首先,结合优化TF-IDF算法挖掘群体用户评论并获取多维情感特征;其次融合多层感知器(MLP)模型进行情感分析,以此获取群体用户情感倾向值;最后引入支持向量机(SVM)、决策树(DT)及朴素贝叶斯(NB)模型验证对比。实验表明所提出情感分类模型的准确率平均相对提高了4.9%,且F值提高了1.7%,能够为情感趋势预测阶段提供较好的基础依据。(3)在时序情感趋势预测过程,将上一阶段得到的群体用户情感倾向值与对应评论时间进行融合,构建群体用户时序情感倾向序列,并提出一种基于多层长短时记忆网络(ML-LSTM)模型的情感趋势预测方法。在大规模真实数据集上的实验效果表明,相比于现有的自回归(AR)模型、长短时记忆网络(LSTM)模型的平均MSE值分别降低了0.5%和0.02%,且ML-LSTM模型分别优于AR模型、LSTM模型的百分比达到了82.9%和13.9%,能够取得更加精准的预测结果。
其他文献
供应链金融是一种新型的融资模式,其以银行、上下有中小企业、核心企业为主体,构建一个系统性、全面性的供应链金融。而在供应链金融中,各个主体都存在不同的风险,影响到供应
<正>日前,"匠心·智造-2018丰田叉车新品推介华东交流会"在位于昆山的丰田工业(昆山)有限公司拉开了序幕。此次交流会围绕"匠心"、"智造",进行了新品宣传和无人搬运解决方案
期刊
关于咏史诗 ,学界已多有论及 ,但主要集中于唐代 ,其它断代性的探讨则较少受到关注。本文拟从“史传”及“抒怀”两种咏史诗体式入手展开论述咏史诗在汉魏六朝的出现和发展 ,
城市商业中心的建设重点之一就是商业空间。广义的商业空间包括商业活动的工作场所以及工作之外的各种社交活动场所和休闲活动中心,商业空间的景观设计主要就是针对这些室内和
随着江西经济的快速发展,矿产资源稀缺与大量尾矿闲置的矛盾日趋显现,本文从理念、制度、技术和资金的角度分析了江西省尾矿资源综合利用过程中的现状和不足。认为要提高江西尾
6月2日,为贯彻落实推进普洱茶地理标志产品保护,打造普洱景迈山古茶林普洱茶品牌工作方案要求,云南省普洱市召开了景迈山古茶林普洱茶品牌建设工作启动会。景迈山古茶林普洱茶品
论述了国内外用天然植物和微生物制备具有降血糖作用的α-淀粉酶抑制剂的工艺过程,同时对α-淀粉酶抑制剂的检测方法进行了总结。
创新已成为发展的第一动力,技术创新的“乘数效应”越大,对经济发展的贡献率就越大,发展质量也就越高。陕西虽然是国家首批的创新试点省份,但是作为能源大省,在全省生产总值
13对于使用属于罕见的红细胞血型的血液或血制品的管理办法的1995隼12月28日法令。有关内容如下:应遵守以下的法律规定,除了对HIV—l与HIV—2抗体检查必做,而又结果一定要阴性外
目的通过检测肺癌患者和健康者的Th1、Th2细胞因子及血管内皮生长因子的表达水平,组间进行对比,统计分析之间的差异性和相关性,探究细胞因子和肿瘤生长因子联合检查肺癌的应