基于算法融合的电商客户流失预警研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:gxblackjack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国经济转向高质量发展,电子商务作为一种新的购物模式应运而生,并且迅速在消费市场获得一席之地。近年来国家为了乡村振兴,也在积极推动农村电商行业的发展。但是,新经济时代,由于线上购物客户与企业之间的非契约关系,还有众多电商企业的兴起,竞争对手不断增多,行业竞争压力激增,客户流失非常严重,企业的利润空间受到严重挤压。在业务多元化的背景下,留住客户是至关重要的,客户是企业生存发展的关键。目前的客户流失研究大多数集中于通信行业、银行、保险公司等,但是对于电商平台客户流失,国内外文献研究并不多,因此,电商平台的客户流失问题一直未得到良好的解决。造成电商平台客户流失的因素多种多样,从企业层面分析,可能的因素有产品质量不稳定、缺乏创新、服务意识薄弱以及高层人员流动带走客户等;从客户层面分析,客户的年龄、收入、受教育程度均可能导致客户流失,还有客户追求新的产品体验也可能导致客户流失到别的企业。因此,建立一个准确的电商平台客户流失预测模型是当务之急,这样不仅可以突破电商平台的发展瓶颈,还能有效提高企业利润,提升客户满意度以及忠诚度,提前识别出有流失倾向的客户群,并对其进行个性化营销,以减小企业的客户流失率,降低企业损失。将此运用于农村电商企业中,更有利于实体经济与农村集体经济加深链接,为推动乡村振兴添砖加瓦。本文旨在建立一个电商平台客户流失预测模型,由于当前研究对于该问题大多构建单一模型,本文进行改进,选用Stacking融合模型,基于6种常用的算法模型,有效提高了模型的预测能力,帮助企业挽留客户,降低客户流失率,对企业未来良性发展奠定基础。本文首先论述了电商客户流失的研究背景以及建立客户流失预警机制的重要意义,梳理近年来相关文献总结出,当前对于该问题大多构建单一模型,本文借鉴前人的研究思路和方法,进行改进,选用Stacking融合模型。其次,本文系统介绍了客户关系管理(CRM)、客户关系生命周期以及客户流失的后果,再次表明建立一个准确的客户流失预测机制,挽留欲流失用户对企业来说非常重要。接着,本文介绍了一些客户流失预测常用算法,例如Logistic回归模型、贝叶斯算法、神经网络算法、SVM算法以及Xgboost算法,还介绍了客户流失数据的预处理理论方法,包括:不平衡数据的处理、缺失值与异常值的处理、特征正态变化、特征标准化以及特征再处理。然后,基于Z电商平台提供的用户行为数据进行研究,首先对数据进行预处理,并通过GBDT进行特征选择,然后构建了 Logistic、决策树、贝叶斯、神经网络、SVM和Xgboost 6个算法模型,然后对调整每个模型的参数,使得模型预测效果达到最好,这里调整参数用的方法是网格搜索法,最后对模型进行评估,评估的工具常用的有混淆矩阵,对其再进行运算、引申,便可得到新的工具,也就是ROC曲线与AUC值,评估发现Xgboost的召回率、精准率、F1-Score均较高,因此,模型的预测效果也最佳,其次Logistic、贝叶斯、SVM的各个评价指标综合来说较为良好,说明以上算法模型适合本文的业务场景。而决策树、神经网络的模型评价结果不尽人意,选择剔除,最后择优选择了 Logistic、贝叶斯、SVM以及Xgboost进行Stacking模型融合,为了避免过拟合,选择贝叶斯、SVM以及Xgboost作为第一层学习器,Logistic作为第二层学习器,得到最终的电商平台客户流失预测模型。在论文的结尾,综合该业务场景与模型结果进行分析,对企业提出一些合理化建议,以提高企业的市场竞争力。本文的创新性之一在于本文通过GBDT来对连续特征进行类别处理,使得特征提取充分有效,显著提升模型的预测效果。其二,本文通过构建了 Logistic、决策树、贝叶斯、神经网络、SVM和Xgboost 6个算法模型,依次对每个模型进行实证分析验证模型的预测效果,最后选用多算法融合建立模型,通过模型评价体系,证明了对于电商平台客户流失问题,融合模型比单一模型的预测能力更强,为未来研究电商平台客户流失问题提供思路。
其他文献
医药CRO(合同研究组织)是指以签订合同的形式承接医药企业、研发组织等药物研发机构的部分或全部研发工作的机构企业。该行业在我国属于是新兴行业,在近十几年来才开始发展起来。与国际大型CRO企业相比,因中国CRO行业起步晚,发展略显落后。目前,我国医药CRO企业规模和水平参差不齐,于是,一些国内CRO企业为了提高竞争力、扩大规模、与国际接轨等目的,在面临产业整合与升级的双重压力下,开始进行连续并购。在
学位
近年来,随着互联网普及率的提升,以数字经济为代表的新经济形态已成为我国经济增长的重要动力。互联网金融是数字经济的典型,特别是互联网金融信息服务市场的崛起,在风险控制、降低运营成本和提高服务效率方面取得了突破。随着互联网及其信息服务生态的成熟,互联网金融信息服务市场也在不断发展。我国金融信息服务市场规模在2020年达到380亿元,同比增长20.63%,说明我国市场对金融信息服务存在着很大需求。金融信
学位
随着中国居民互联网在线购物和使用的规模不断扩大,互联网在线消费已经成为了我国数字经济发展的重要组成部分,其在推动网络消费和市场发展等方面也逐渐起到越来越关键的作用。互联网技术的快速发展创造了一个宣传口碑的新平台,因此口碑逐渐超越了地理位置与时间的局限,也开始变成了企业网络营销以及服务品质管理必须考虑的关键因素,同时也是帮助消费者做出正确购买决策的重要信息源泉。随着移动网络平台的迅猛发展,更多的消费
学位
基于机器学习的数据分析方法,用于解决经济社会发展中的问题,已被广泛应用于经济、金融和工业等各个领域。机器学习模型有着良好的泛化性和鲁棒性,比较适合工业经济水平预测。工业经济水平就是指工业发展水平,内在可以在工业企业资产、企业从业人员工资和工业企业用电规模等因素上体现,外在表现为经济增长,也就是工业生产总值上。本文研究建立在内在因素和外在体现(经济增长)的关系上,通过对安徽省工业各指标数据的分析处理
学位
2008年,证监会颁布了《上市公司重大资产重组管理办法》,该办法规定:“上市公司购买资产的,应当提供拟购买资产(或购买资产后上市公司)的盈利预测报告,……,交易对方应当与上市公司就相关资产(或上市公司)实际盈利数不足利润预测数的情况签订明确可行的补偿协议。”此规定本意是约束并购双方的行为,保护并购双方及中小股东的利益。但是在资本市场中,由于信息不对称,监管机制不健全等因素,并购中经常会出现乱用业绩
学位
超分子化学的主要目标是通过非共价相互作用连接多种化学成分,构筑新型的功能体系。第一代超分子主体冠醚从最简单的单冠醚到双冠醚、三冠醚等具有一定功能性的冠醚一直是化学家们的研究热点。偶氮苯作为一种光致变色物质,在光诱导下不仅可以引起偶氮苯单元的顺-反异构,产生变色效果,而且还伴随着偶极矩和几何结构的改变。因此将这种具有光响应性能的偶氮苯单元与冠醚相结合可以赋予冠醚不同的识别和组装性能。本文设计合成了偶
学位
随着信息化建设迅速发展,电信市场趋于饱和,通信行业面临着竞争激烈、产品同质化严重、客户流失等诸多问题。如何通过海量用户数据准确地预判用户的流失趋势并针对性地挽留潜在流失用户,这是目前通信运营商迫切需要解决的问题。本文以某运营商部分用户数据为研究样本,利用模型融合技术对用户流失趋势进行预测,旨在探索多模型融合方法在电信运营商的用户流失预警模型中的应用,帮助运营商做出科学的策略制定。本文首先从我国电信
学位
本文是关于聚思鸿集团2020年年度报告的英译汉翻译实践报告。2020年对于聚思鸿来说是具有划时代意义的一年,这一年聚思鸿成为独立的上市公司。2021年3月,公司发布2020年年度报告和致股东们的一封信。该报告阐述了聚思鸿公司2020年的真实经营状况和重大事项及各项事宜。信中描写了 2020年新形势下的政策变化,同时表达了对股东,客户及全体员工的感激之情。此次翻译文本选取聚思鸿年报的第一部分内容和致
学位
聚酰亚胺(PI)作为有机类光催化剂,具有结构可调性强和机械性能、耐热、稳定性好等优点,并已展现出良好的光催化效果。为了得到性能更好的聚酰亚胺,并将其扩展到更多的领域,聚酰亚胺的改性成为了近年来的研究热点。本文研究了热缩聚条件对PI能带结构及光催化活性的影响,并制备了PI/Ni O、聚酰亚胺纤维/二氧化钛(PIF/Ti O2)复合光催化剂,采用XRD、SEM、TEM、FTIR、BET、DRS和XPS
学位
SBA-15负载纳米过渡金属、纳米半导体氧化物等活性组分制备介孔高效负载型催化剂,以其独特的特性和优异的修复性能,在光催化去除水中难降解有机污染物领域受到越来越多的关注。但是在实际催化应用中,SBA-15载体由于介孔孔径较小,在一定程度上影响反应物与产物分子的扩散速率进而影响催化效率。本研究拟用双模板法制备SBA-15基多级孔SiO2载体,微波诱导法制备了液体纳米SnO2催化剂,并将两者复合制备出
学位