基于特征选择和模型融合的网络购买行为预测研究

来源 :北京交通大学 | 被引量 : 18次 | 上传用户:lipz7517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络购物已成为人们日常生活中必不可缺的一部分。网络购物中顾客和商家不需要面对面交易,这使得商家不能很好地把握消费者的想法和需求。但是顾客的购物行为的任何一个细节却服务器记录着,这使得通过分析这些行为数据来了解消费者的偏好甚至实现预测其购买行为成为可能。因此本文提出了使用大数据分析方法——机器学习算法从大量的消费者历史网购行为数据中学习出隐含在其中的购买模式获得模型,当新的顾客购物行为数据被输入到该模型中时,即可实现对顾客购买行为的预测。本文首先对网络购买行为的影响因素和预测研究进行了文献综述,深入了解网络购买行为的本质并发现目前基于大数据分析的网络购买行为研究仍处于起步阶段。所以本文以阿里巴巴举办的大数据竞赛作为研究背景,并将用户在阿里巴巴电子商务平台上真实的购物行为数据作为研究数据,通过使用机器学习算法对网络购买行为进行建模。首先使用Sql Server在原始数据的基础上构造了 322个特征,并基于Extra-trees算法提取出对于预测购买行为最有帮助的10大特征。然后本文选择了两种常用的机器学习算法:逻辑斯特回归和支持向量机,将这10个特征分别输入两个算法得到两个预测模型。最后本文基于Soft-voting的方法对以上两个算法进行融合。实验证明,融合后的模型较单一的模型具有更好的预测效果。本文的研究以数据为驱动,旨在实证说明使用消费者的历史购物行为预测其未来购买行为的可行性。本文的预测模型可以被用于购物网站的推荐系统中,实现用户界面的完全个性化,激发顾客的购买欲望,提高电子商务平台的转化率。
其他文献
“4·20雅安地震”距今已有3个多月,然而慈善的脚步从未停歇。6B30日,浙江省区域经济合作企业发展促进会(以下简称“促进会”)组织浙商共30余人,奔赴四川省雅安市天全县新场乡
读《浙商》9月上《谢宏“卸甲”真相》一文,我有些话要说。,尽管认为“老板是给打工者打工的”这一说法很矫情,但我依然对“老板不是人做的”这句话很有共鸣。在中国做企业,特别
今年以来,江干区抓住浙商回归的历史机遇,拉开了打造“浙商总部中心”的序幕。随着钱江新城作为杭州CBD地位的巩固,逐步成为杭州的政治、经济、文化和交通枢纽新中心.为浙商转型
互动、高清发展如火如荼,但近6000万的已整转用户呢?如何在“交互过渡期”内,基于存量用户的单向网环境,尽快培育起“用电视”的行为偏好,数据广播依然有潜力可挖。 Interac
我注意到贵刊今年新开辟了一个栏目——“解密”,并将讲述对象瞄准了历史上大名鼎鼎的浙商群体,很有厚度。观察这些历史人物,将其放回历史现场,会发现他们的行事远远超越商人的身
使用高阶间断 Galerkin 格式求解守恒律方程组时,激波附近的 Gibbs 效应容易导致非物理解的产生。为抑制这一现象,必须构造合理的限制器对数值解进行处理。目前间断 Galerkin
发展了无粘外流解与气动热工程方法相结合的用于全机外形复杂流动气动加热计算技术,并将其与动态多体分离过程流场解相结合,提出了一种高超声速飞行器多体分离过程气动加热特性
本文针对当前小学语文课堂教学中存在的问题进行原因分析,并提出具体的教学策略:采用多元化的教学方法,教师注重提升自己的业务能力与学生沟通时注重话语的艺术性。从而达到
本文通过对党校特色数据库的运行现状进行分析,提炼出在使用中存在的主要矛盾,有数据需求与成果供给之间的矛盾,数据分散与数据共享之间的矛盾,馆员服务僵化与用户信息素养提
近年来高超声速飞行器气动弹性( 尤其是热气动弹性) 问题的关注度不断增强, 相关内容已成为学术界的重点研究方向.本文旨在总结高超声速气动弹性问题的近期研究成果, 并对进一