基于大数据算法的G物流公司客户流失分析

来源 :东华大学 | 被引量 : 0次 | 上传用户:oldbuck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当物流行业取得飞速发展的同时,给物流企业也带来了巨大的挑战。物流企业一是起步晚,根基弱,二是管理不成熟,市场竞争力大,导致客户流失率高。如何降低现有客户流失率,维护好老客户的同时开发更多新客户,是当前物流企业所面临的关键性问题。因此,本文从物流企业客户流失这个实际问题出发,构建出物流企业的客户流失预测模型,以G物流公司实际客户数据为背景,运用随机森林等算法,通过对G物流公司客户行为数据的研究与分析,挖掘出已经流失客户的行为特征,对未来可能流失的客户进行提前预警,并提出客户挽留策略,帮助物流企业改善企业流失现状。客户流失预测问题可以视为数据挖掘中的大数据分类问题,因此本文将利用大数据分类算法对客户流失问题进行预测分析:(1)首先明确了物流企业客户流失问题。本文系统的分析了物流企业行业现状,客户流失预测研究现状,给出了企业客户流失定义,明确了物流客户流失这个具体研究问题。(2)其次本文针对物流企业客户数据集存在的样本正负不平衡问题,采用数据均衡化处理,对数据集进行异常值、缺失值和分层处理,结合SMOTE算法进行插值过程对G物流公司客户数据集进行了平衡化处理,最终使得正负类样本集达到均衡。(3)然后对特征指标进行高效筛选。本文运用随机森林基尼重要度进行特征选择,选取了G物流公司客户流失数据集进行特征筛选,选出了17个特征指标,去除无效特征,选出12个特征指标,并将该子集输入到SVM模型中,其模型精度提高了2.29%。(4)最后基于随机森林模型进行客户流失预测模型构建和模型对比。本文结合数据挖掘机器学习,构建基于随机森林的G物流公司客户流失预测模型,并将模型结果和线性支持向量机、朴素贝叶斯和逻辑回归模型比较,实验结果表明,基于随机森林的客户流失预测分类模型准确率比其他模型高9%。本文一方面从客户流失预测研究中存在的问题入手,将大数据算法应用到客户流失预测问题中,先对不平衡数据进行均衡化处理,在此构建了基于随机森林算法的客户流失预测模型;另一方面,将提出的客户流失预测问题以实际物流公司为背景,将其客户数据进行分析并建模,构建了实际物流企业的客户流失预测模型,最后再跟其他算法进行对比分析,指出本文算法的可适用性,并针对不同细分价值进行客户挽留策略。
其他文献
研究了氧化剂种类,包括H2O2、Na2S2O8、O2、CH3COOOH、(NH4)2S2O8和DMD(dimethyldioxirane),对固载型漆酶和Co(salen)/NaY一锅法催化氧化木素的影响,通过正交和单因素实验对
目的:探索预防花斑癣复发的治疗方法。方法:将60例确诊为花斑癣的患者随机分为两组,每组30例,实验组予伊曲康唑胶囊口服,同时每晚用上海药皂洗澡,对照组只用伊曲康唑胶囊治疗,
企业购买与个人购买有很大的不同之处,因此,作为营销人员,了解影响企业购买行为的因素是很有必要的,本文就这个问题给予了全面的论述.
<正>11月份,英国脱欧进程迎来重大突破,英国与欧盟终于达成了脱欧协议草案。如今,欧盟27国部长支持脱欧协议草案,不会重新协商该草案。而英国首相则因协议草案陷入执政危机,
21世纪以来,以高血压为代表的慢性非传染性疾病已成为危害百姓健康的主要公共卫生问题,它们具有病程长,难治愈等特点,给家庭和社会都带来了沉重的经济负担。而融预防、医疗、保健
聋童的家庭教育较正常儿童的家庭教育更具有重要意义.聋童的家庭教育除教育之外,还有康复的任务,其意义是深远的.本文根据有关文件要求,结合聋童家庭教育的实际情况,提出家庭
低温地板辐射采暖工程属于隐蔽工程,设计寿命50年,系统中通过的是60℃摄氏度的热水,意味着当加热管由于质量问题出现爆管时,建筑物的地面也就随之被破坏,损失巨大。管材的选
随着经济的快速发展,我国社会体育指导员的发展也取得了一定的成绩。社会体育指导员能促进我国全民健身活动的顺利开展。文章分析了我国社会体育指导员发展的动力机制,动力机
随着新媒体的兴起,传统媒体所受的冲击越来越大,特别是纸媒行业,所面临的局面十分严峻,传统媒体的从业人员不得不面临转型,尤其是纸媒记者的转型压力最大,本文探讨的主要内容
看电影学英语可以有效地提高学习者的听说能力,也是学生比较喜爱的学习英语的方法之一.本文介绍了看电影学英语的一些诀窍,如做好物质准备、电影的选择、学习原则和步骤等.