基于组合算法的社区团购平台客户流失预测分析

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:liuxiaotiancxks
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社区团购业务作为电子商务领域的一个后起之秀,开始越来越频繁地出现在大众视野和商业实践中,众多大平台携带雄厚的资本和丰富的资源进入社区团购的赛道,推动了社区团购业务快速发展。目前,社区团购业务领域尚没有出现一家独大的局势,市场竞争激烈,客户可以轻易地从一个社区团购平台转换到接受竞争对手提供的商品或服务,普遍对社区团购平台忠诚度低,流失率居高不下。社区团购平台的服务策略因此转向以客户为中心,试图通过客户流失分析改善平台与客户的关系,而目前关于客户流失预测的研究分析主要集中在通信、银行领域,本次研究将客户流失预测模型运用到社区团购业务领域中,探寻构建预测模型对社区团购平台客户流失与否进行预测的可行性。本次研究基于某社区团购平台上海地区的真实交易数据,借助数据仓库技术抽取客户的基本信息及订单流水信息加以汇总,结合对社区团购业务实际情况的理解筛选出可用于预测的特征变量。对于提取出的原始数据在构建模型前进行预处理,在经过重复值处理、缺失值处理、异常值处理、数据标准化等步骤后成为规整的数据集,在原有特征变量基础上生成新的衍生特征,结合特征选择最终确定了用于构建客户流失预测模型的14个预测特征。为了有效处理样本数据集中流失客户与非流失客户极度不均衡的现状,本次研究选择SMOTE-ENN混合采样算法重新定义类分布,最终流失客户和非流失客户在数量上达到了平衡。为了确定重采样算法对预测模型性能的影响程度,将基于SMOTE-ENN算法重采样数据构建的的模型同基于其他单一的重采样方法搭建的模型进行性能比较。在确定了重采样方法后,本次研究采用将极限学习机与遗传算法模型融合的模型,为了研究组合算法的预测性能,将组合算法和其他常见分类算法作比较,对比精度、查准率、查全率、AUC值等指标结果。实验结果表明,采用SMOTE-ENN算法进行重采样能够提升客户流失预测分类模型的预测效果,以此为基础的极限学习机和遗传算法组合模型的各项指标得分位列前茅,AUC值达到0.8528,要高于其他常见的分类算法模型,由此可见采用极限学习机和遗传算法组合模型来预测社区团购业务领域的客户是否会流失是可行有效的。最后将通过基于K均值聚类算法的RFM模型对社区团购平台客户的价值分群结果和基于Relief算法的特征选择筛选出的变量指标结果综合考虑,提出相应的建议措施来避免社区团购平台客户流失,尽可能地降低社区团购平台客户的流失率。
其他文献
2021年7月24日,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生学业负担和校外培训负担的意见》,“双减”政策的出台,旨在减轻学生和家长的教育负担,强化学校作为教育主阵地的作用,对教培机构加强治理,改善教育内卷的现象。“双减”政策对学生、家长、教师以及校外培训机构人员的生活的方方面面都产生了影响,在网上也引起网民们该政策的高度关注。同时由于大数据时代的到来,信息的传播变的更为迅
学位
随着国民文化自信、民族自信全面增强,传统文化的再次活跃引发“国潮热”。在这股“国潮热”下,外来国际品牌前进的脚步并没有停下,严峻的市场竞争促使国内运动品牌不得不再次思考如何在国内市场“站稳脚跟”,提高自身的竞争力。在线评论是一个低成本获取用户反馈的渠道,通过评论内容,可以获取用户对商品各个属性的情感倾向,可以为消费者购物提供参考和帮助商家提高产品质量。因此本文选取了国内运动品牌代表李宁和国际运动品
学位
经济全球化的逐渐深入,各国的发展非常迅速,国民经济发展较为迅速,带动了房地产行业的发展,房地产行业属于资金密集型产业,公司负债率较高,由于房价居高不下,居民的收入跟不上房价上涨的步伐,因此许多居民处于买不起房的处境,导致房地产行业大量房地产库存积压,产能过剩,我国的金融市场不稳定,缺乏一套完善的金融管理机制,房地产由于房屋销售过少,资金不够偿还债务,导致公司周转存在问题,存在较大的财务风险,加大了
学位
“十四五”规划明确提出产业数字化转型,积极推动数据赋能全产业链。中国信息通信研究院发布的《中国数字经济发展白皮书》显示,2020年我国数字经济规模达39.2万亿,占GDP比重为38.6%,同比增长了9.7%,数字经济总量跃居世界第二。国家统计局公布2021年前三季度与数字经济相关的高技术制造业、信息传输、软件和信息技术服务业均领跑产业发展,数字经济是经济增速发展的重要推动力量。货运行业的数字化转型
学位
改革开放四十余年来,我国的经济社会进步,收获了重要成果,人民民众生活水平明显提高,满足了生活物质条件,提高经济增长的效益成为新目标。疫情当下,国内经济发展面临重大压力。在这种背景下,政府支出在稳定宏观经济方面的作用和责任重大。基于以上情况,本文从全国和东中西部地区两个角度出发,选取人均实际GDP的对数作为被解释变量,城镇登记失业率的对数和实际固定资产投资额占实际GDP比值的对数作为控制变量。关于我
学位
互联网时代信息爆炸式增长、知识传播速度加快等因素给整个社会带来了海量的信息。但是,大多数信息知识都很宽泛、缺失针对性,呈现碎片化的形式进而导致人们无法精准有效的获取自身所需。在此背景下,知识付费应运而生,让人们摆脱普遍存在的知识焦虑,满足现代人的精神需求。然而,随着知识付费行业规模的不断扩大,付费产品价格定价虚高、知识付费平台恶意竞争等问题的出现让高歌猛进的发展热潮逐渐消退,而且出现了越来越多的质
学位
我国经济高质量发展概念于2017年第一次被提出,在十九届五中全会,针对中国当前经济发展阶段、环境、社会要求的重大转变,明确提出了“十四五”新时代的中国经济发展,要以促进高质量发展为主体的科学判断,更是把经济高质量发展摆在前所未有的战略性地位高度。目前学术界对高质量发展的研究多是以“五大发展理念”和社会矛盾为基础,或采用单一指标代表。本文在前人研究的基础上,基于“十四五”纲要,充分考虑中国现实基础和
学位
由于投资者的时间和精力都是有限的,所以在进行投资决策时投资者只会被自己所关注到的信息所影响,并且股票市场信息具有不对称性,这往往会使得股票市场收益率出现异常波动。随着互联网技术的发展,投资者信息来源渠道逐渐多样化,网络搜索信息能够直接反映出投资者的搜索需求,同时也能够在一定程度上反映出投资者进行投资决策时的关注重点和方向。基于以上研究背景和启发,本文探究了投资者关注对新能源汽车概念股收益率产生的影
学位
推荐系统是现代社会处理数据和信息的重要方法,基于矩阵分解方法的推荐模型可以有效的提高推荐系统性能,但是它会受数据稀疏和冷启动问题的困扰。在真实业务场景里,往往难以收集用户对物品的直接评分,但用户行为等隐式反馈能在一定程度上反映用户兴趣,且易于记录和存储,可以缓解数据稀疏问题。随着深度学习的兴起,对文本信息的挖掘技术越来越成熟,给用户预配置文本信息,也可以丰富推荐系统输入数据来源,并克服给新用户推荐
学位
随着全球化的发展,各国之间经济、金融、贸易、投资等合作不断深入,持续影响着国与国之间的交流发展,而跨国活动需要货币兑换,国与国之间的兑换比率,即汇率,对平衡国家之间的经济发展,反映国内国外的经济水平与综合实力显得尤为重要。跨国经济活动离不开汇率,在当下,经济形势变幻莫测,汇率变化也错综复杂,因此,对汇率及其波动特征的正确分析与认识将有利于维持我国经济环境的稳定,而对汇率未来波动趋势及变化空间的研究
学位