基于商品评论信息的用户行为研究

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:gululukuaican
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,电商平台购物越来越成为人们进行商品购买的一个主要渠道。随着用户对电商平台使用的不断增加,在电商平台上留下了关于用户商品购买行为的海量数据,对这些行为数据进行挖掘与分析,不管是对用户还是商家来讲都是非常重要的。本文通过对电商平台的海量行为数据进行分析,获得用户购买商品的主题倾向,用户的社区偏好和用户的购买倾向等信息,这些信息可帮助商家进行商品促销与仓库备货,也可为用户按需购买商品提供便利。基于此本文主要从三个方面进行研究,具体如下:1.针对短文本由于缺乏足够的上下文信息,使得在应用传统主题模型进行短文本主题挖掘时产生数据稀疏的问题,本文提出一种基于语义增强的短文本主题模型算法。算法将DMM(Dirichlet Multinomial Mixture)与词嵌入模型相结合,通过训练全局词嵌入与局部词嵌入分别获得词的向量表示;随后融合全局词嵌入向量与局部词嵌入向量计算词向量间的语义相关度,构建主题词的语义相关词集,并计算主题词的相关词权重;然后通过主题相关词权重进行词的语义增强计算,最终实现词语的主题模型挖掘。实验表明,本文提出的短文本主题模型在主题一致性表示上更准确,且提升了模型在短文本上的分类正确率。2.针对密度峰值算法在社区划分应用中出现的由于截断距离的选取与仅考虑社区网络拓扑结构导致的社区划分不准确的问题,提出一种融合用户的结点属性和所在网络的拓扑结构的密度峰值社区检测算法。算法首先利用用户网络拓扑结构计算用户结点与其直接邻居与间接邻居的度,用度来表示结点间的局部密度;然后将用户对商品的评论信息主题偏好作为用户结点的属性,结合网络拓扑结构计算用户间的相似度并用其表示用户间的相对距离;最后选出关键结点作为社区的中心结点并完成社区划分。实验表明,提出的算法在ACC指标与NMI指标上均优于基线模型算法,且提高了电商网络平台上社区检测算法的准确度,实现了高效的社区划分。3.针对目前大多数用户购买行为预测只是利用用户对商品的浏览查看操作,对商品的收藏行为以及将商品加入到购物车中的行为,而很少对电商平台上用户的评论信息进行分析的问题,本文提出一种利用用户商品评论信息的情感极性与用户社区影响力进行用户购买行为预测的方法。方法首先利用基于词典的情感分析方法获得用户对商品的购买情感极性,然后获取用户所在社区中的用户影响力;采用基于模糊性技术整合用户的购买情感极性与社区影响力,从而对用户购买情感极性进行最后计算;最后根据计算结果对用户的商品购买行为进行预测。实验表明,本章所提出的方法相比于传统的用户购买行为预测方法能更客观、更准确地获得用户所传达的情感极性,并在用户购买行为预测方面比基线模型有更好的预测精确度。
其他文献
在数码印花行业中,印花缺陷的检测是保证产品质量的重要环节。通常厂家都是采用人工目测的方式进行印花缺陷检测。但人工检测往往会提高劳动成本,且肉眼具有疲劳性,无法保持检测效率。因此,为代替人工检测,本文针对数码印花生产过程中出现的印花缺陷问题,开发了基于机器视觉的数码印花缺陷检测系统。总结分析数码印花缺陷特性后,设计了数码印花缺陷检测系统算法。算法大致分为三部分。第一部分为图像预处理,通过灰度化、伽马
近年来,随着人民生活质量提高,以混色纱线为原料的智能化纺纱产品市产需求日益增加,然而混色纱线在上料抓取的过程中存在诸多难点,难以实现真正自动化。因此,针对现有混色纱线自动化上料抓取装置体积大,抓取定位不精准,且效率低下等问题开展研究,设计一种适合混色纱线高效上料抓取的仿生学机械手。首先,根据混色纱线上料特性,在研究仿生学原理的基础上,对上料抓取机械手进行结构设计。通过研究实际抓取需求及人体手指结构
目前,伴随互联网与传统工业的融合发展,工业生产越来越向数字化和智能化发展。由于数据量的巨额幅度扩充,云计算与物联网的应用逐年增长。但是越来越多的工业生产需要实时和高效处理资源调度问题,因此,本文在边缘计算技术的基础上对智能车间的资源调度进行研究。主要研究内容如下:(1)通过对智能车间中物联网-云架构和边缘计算参考架构的分析,选择在物联网-云架构中加入边缘计算参考架构,从而设计出智能车间的资源调度架
当前我国碳纤维复合材料产业正处在由发展壮大向产业成熟过渡的关键时期。与传统树脂基碳纤维相比,铝基碳纤维具有防辐射、导电性能好等特点,目前已成为最具发展潜力的复合材料之一。在实际工程中,碳纤维的应用可以明显减轻设备重量,提高设备的机械性能。镀铝碳纤维作为铝基碳纤维复合材料的其中一种形式,研究其力学性能,具有重要的实际应用价值。本文针对镀铝碳纤维对发动机连杆性能的影响,归纳了有关碳纤维复合材料的国内外
针对国家电网公司颁布并实施的DL/T698.45-2017面向对象的用电信息数据交换协议标准,本文需要在一款关口电能量远方终端上实现这一协议标准的软件包,以达到自动抄读遵循DL/T698.45-2017标准的关口电表的目的,项目研究和产品设计具有较高的实用价值。为了达成项目研究的目的,先对所研究电能量远方终端的软硬件体系结构、工作原理进行了分析研究,掌握原应用软件中协议包模块的架构、数据结构和软件
由于体育课程的编排工作会受到上课场地、上课人数以及课程性质等因素的影响,并且各个高校使用的排课系统难以满足对体育课程的编排工作。因此,设计和开发一个适合体育课程编排的系统十分必要。本文通过对目前广泛使用的基于遗传算法的排课系统进行研究,发现其二进制编码很轻易的就导致海明悬崖现象的出现,以致于交叉运算操作和变异操作无法跨越,使得遗传算子的搜索速度快速下降。而实数编码没有任何的编码和解码过程,在计算时
随着计算机技术的快速发展,云通信技术在物联网连接服务领域已经广泛应用。电力企业为了建设专业的大数据中心,采用新的技术手段对先前部署的物联网系统进行升级改造。为了提高其中用电信息管理系统自动抄表子系统的通信效能,本文提出了使用云通信IM即时通信方式搭建用电信息传输通道的解决方案,因此本文在云通信的基础上对用电信息传输的技术展开了深入的研究和探索。为了利用云通信技术改善用电信息管理系统中自动抄表主站与
成本管理是企业管理的重要组成部分,成本管理方法的科学性尤为重要。目前在我国,由于产能过剩,钢铁企业面临着激烈的市场竞争,迫切需要加速转型升级,这对钢铁企业有效的成本控制和精准的成本核算带来了挑战。传统的成本核算方法很难满足管理需求,因此迫切需要一种更科学严谨的成本管理方法,来提高企业竞争力,满足企业的生存和发展需求。本文针对韶钢炼钢厂对改进成本管理方法的迫切需求,采用案例分析法和比较分析法等方法,
随着互联网与传统工业的融合发展,市场需求不断变化,传统车间生产模式已经不能满足当下市场环境,企业为了能紧跟市场发展并快速适应市场变化,需要将生产模式进行改变,而生产模式的转变意味着车间生产环境愈加复杂,致使生产物流的畅通性难以保证,在当前生产车间中,高效的车间生产与低效混乱的物料配送之间的矛盾仍然存在,为了提高车间生产效率和企业竞争力,优化配送路径是首要选择,因此本文以柔性生产车间物料配送为研究背
税务咨询问答业务量大,要求专业程度高,且近年来新出台的税收优惠政策较多,纳税人对税务方面的咨询需求也是日益见长。现有的税务咨询方式大都是办税大厅现场咨询或电话咨询,税务工作者需要针对纳税人的问题,不断学习和查阅相关政策法规,并且咨询量较大,使得税务机关面临着巨大的咨询压力。在计算机应用技术发展飞速的今天,虽然一些税务机关也开始尝试利用互联网进行线上税务咨询,但大都是留言咨询,需要人工对问题进行解答