基于LightGBM算法的线上消费者购买意向研究

来源 :华中科技大学 | 被引量 : 1次 | 上传用户:yellowyangjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,移动应用和电子支付技术的不断发展,电子商务突破了时间和空间的限制。消费者能随时随地消费的同时,也期待更优质的购物体验和个性化服务。现下常见的电商营销手段如发放优惠券和商品推荐都是基于消费者在线行为数据分析得到的。通过分析用户的历史行为数据,精准预测购物意向,能进一步为消费者提供有针对性的高质量服务,促使其消费进而提高购买转化率。因此如何有效利用消费者行为数据,分析其购物需求是所有电商企业面临的挑战。基于上述研究背景,本文旨在提出一个在线消费者行为分析系统,利用消费者行为数据构建数据挖掘模型,综合不同的影响因素对消费者购买决策的影响,最终对用户的购买意向做出预测。根据不同的购物意向,可以提供个性化的服务,提高购买转化率。论文主要研究工作有:(1)消费者行为数据预处理和特征工程。重点研究了异常值处理、特征选择和不平衡数据过采样方法的原理以及实现。(2)构建模型。对支持向量机、随机森林、梯度决策树和LightGBM四种候选算法进行建模和调参,并对预测精度等四个方面进行综合评估。(3)对LightGBM模型的特征选择、基于代价敏感方法处理不平衡数据和划分购物意向三方面作进一步研究。实验结果表明,经过超参数优化的代价敏感LightGBM模型对电商消费者行为预测效果最优,AUC值达到0.893。综合评估发现该模型对消费者的购物意愿具有良好的预测精度、泛化能力以及实时性,一定程度上满足在线消费者行为预测系统的要求。此外还发现点击流数据传达了消费者购买意向的重要信息,利用分类器输出预测概率对用户的购物意向作进一步划分,能初步定位忠诚用户、潜在用户和流失用户,进而制定有针对性的营销策略,实现精准营销。本文通过以上研究,丰富了基于消费者行为数据对购买意向的理论基础,为在线消费者行为分析提供一种较好的模型,对建立实时在线消费者行为分析系统具有一定的理论意义和实践意义。
其他文献
2021年新高考全国1卷研究函数两个零点x1和x2的大小关系,最终采取的方式都是利用函数值的大小来确定自变量的大小,总的来说属于双变量问题探讨.本文详细分析这道试题,给出一题多解,从中归纳处理极值点偏移的通性通法以及处理双变量问题的基本思路,并从高等数学的观点揭示极值点偏移的内在原因,同时遵循命题规律,给出这两道试题相应的改编命题,最后总结梳理高考中具有代表性的双变量的问题.
期刊
抑郁症是近些年来社会影响较大的疾病,而功能磁共振成像的发展正好为抑郁症的脑研究提供了技术支持。基于功能磁共振成像数据,本文旨在用机器学习的方法对听觉刺激下的重度抑郁症患者进行分类,并对特征体素进行功能定位,为抑郁症的诊断、预后及发病机制的脑研究提供参考脑区。基于音乐刺激下的功能磁共振成像数据,本文首先借助SPM完成了图像预处理,其中包括层间时间校正、头动校正和空间标准化三个步骤;然后,本文借助Py
学位
随着我国城市发展体系逐渐走向成熟,城市化水平不断提高,超大城市、特大城市居民出现了不同程度的健康需求,而现有城市空间多是注重其功能性,追求容积率,对健康需求的满足形式较为单一。本文以城市空间中的城市公园作为研究对象,结合居民健康需求,提出以复愈性环境理论为基础的设计理念。首先对复愈性环境理论进行深入研究,在理论的基础上设计城市公园中复愈性环境构成要素和居民复愈性行为特征的问卷调查,基于SPSS软件
学位
近年来信息化技术、大数据技术、机器学习得到了长足的发展,健康中国的概念也逐渐得到了普及,大量丰富的医疗数据可以提供潜在的有价值的信息,将机器学习中的方法运用到医疗数据集中逐渐地成为研究热点,在一定程度上可以帮助相关医护人员提高疾病诊断的效率、减轻患者的一些治疗痛苦。医疗数据集可能会因为数据收集人员的操作失误或者是测量技术的有限而出现缺失值的情况,因此,本文主要为了解决医疗数据集中存在的缺失值的问题
学位
随着现代社会的不断发展进步,智能技术逐渐融入到我们社会生活的各个方面,智能技术推动城市发展进入智慧建设阶段,城市智慧环境设施应运而生。现阶段城市智慧环境设施的设计存在的文化性匮乏与智能化不足的发展现状难以满足未来智慧城市的发展与广大城市民众的需求。站在设计学科的视阈来看,城市智慧环境设施在追求智能技术的应用中缺少了对文化特色的理解与注入。深圳市处于智慧城市建设的第一梯队,其智慧城市的规划设计与建设
学位
在当今互联网时代,智能手机的使用越来越普及,移动APP广告因为其移动、互动和受众面广等特性受到很多人的青睐,成为互联网广告领域的重要分支。一般地,可以用广告点击率来看某条广告投放效果的好坏,但对于广告主而言,转化率与其收益有着更直接的关系,因此,对广告转化率预估的研究有着很强的实际应用价值。但由于数据高度稀疏等原因导致目前对广告转化率预估的研究效果没有很好。根据以上描述的情况,本文通过对用户、广告
学位
改革开放政策使我国经济高速发展,而人口流动对经济增长的贡献率高达20-30%,流动人口是我国劳动力需求的主力军。对于流动人口问题,当务之急就是要加强流动人口的职业健康和家庭发展,促进流动人口社会融合。在劳动力迁移过程中个人的居留意愿可以体现个人以及每户家庭在流入地的基本生活状态。本文通过关注劳动力迁移过程中劳动力的个人因素:性别、年龄、教育年限、户籍类型、社会满足感等,研究得出劳动力迁移过程中居留
学位
近年来,互联网金融的飞速发展对商业银行的信用卡业务造成了重大冲击。而信用卡业务已成为零售银行业务的主要利润来源。保持客户忠诚度对当前遭受互联网金融入侵的信用卡业务而言具有深远意义。目前学术界对客户忠诚度的实证研究主要是在特定行业背景下研究客户忠诚度的影响变量;对客户忠诚度预测问题的研究主要集中于不同忠诚度模型的探索上。但是所用数据基本是问卷调查数据或者数据的时间跨度较小(比如一个月),对于时间跨度
学位
近年来,地铁成为居民出行的主要交通工具。随着地铁线路的不断完善发展,地铁客流量不断增加,这容易造成地铁站客流拥堵,不利于居民出行及地铁运营管理。因此实现对站点客流量的短期预测能够帮助优化地铁运营管理,保障市民安全出行。本文收集杭州市AFC系统的所有地铁站刷卡数据信息,对数据进行处理后建立短期客流量预测模型。本文首先进行数据处理,将原始数据转化为各站点每十分钟客流量数据,并从站点和时间两个方面对客流
学位
近年来,随着我国金融市场的不断发展和创新以及社会融资需求的不断增加,影子银行作为商业银行的有效补充迅速扩张,成为金融体系的重要组成部分。影子银行的出现虽然一定程度上满足了社会资金需求,但其本身具有的特性也成为重要的金融风险来源之一,因此,防范影子银行引发的系统性风险非常有意义。本文通过构建影子银行风险预警线和风险预警模型来对影子银行的风险状况进行预测,辅助相关部门的防范措施制定。本文再对前人的研究
学位