基于交易数据的客户流失预警模型

来源 :科学导报·学术 | 被引量 : 0次 | 上传用户:sst3562008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:面对瞬息万变的市场需求和日益激烈的市场竞争,客户关系管理对于现代企业的重要性日益凸显。客户流失预警是利用数据挖掘技术发现即将流失的客户名单,从而为企业有针对性地开展客户维系与挽留工作提供科学依据。国内外学者已经围绕客户流失预测模型做了许多研究,目前使用最为广泛的三种算法是Logistic回归、决策树和人工神经网络。由于实验数据的差异,这些研究所得到的结论也不尽相同。而且,现有研究大多基于模拟数据和用户消费数据,包含直接可用的预测变量,而鲜少涉及第三方支付行业常见的商户交易流水这一数据形式,如何从非结构化的交易流水中提取特征仍是一大难题。本文对某第三方支付公司提供的商户交易流水数据进行了整理和分析,结合业务经验构造了六个维度的特征用于预测客户流失情况,精心准备建模数据。运用主成分分析方法,解决了这些变量间存在的共线性问题。然后,分别采用传统的 Logistic回归方法和基于决策树的LightGBM、基于神经网络的多层感知器两种不同的机器学习流行算法建模,得到定量分析结果,并对其进行定性分析。一方面,对模型进行解释,寻找客户流失关键因素;另一方面,对比不同算法在客户流失预测场景下的预测性能,探讨算法的适用性。实验结果表明,简单的 Logistic 回归即可取得较好的效果,LightGBM和 MLP进一步提升了预测的准确度,且两种方法的预测性能没有明显的优劣之分,在解释能力和泛化能力上各具优势。对于变量重要性,近期内(1 个月左右)商户的交易金额和交易笔数的变化率对模型预测结果影响最大,是实际的客户流失预测工作中需要重点关注的变量。
  关键词:流失预警;非结构化数据;主成分分析;LightGBM;多层感知器
  一 相关理论基础
  (一)客户流失理论
  客户流失表现为客户为企业带来的价值的减少,不仅包括彻底终止与企业交易的行为,也包括减少与企业的交易次数、同时增加与竞争企业的交易频率的行为。本文对客户流失的定义是:若某个商户连续 3 个月没有产生交易流水记录,则认为该商户已经流失。
  对于有流失倾向的客户,针对性地采取挽留措施,重建良好客户关系,保障企业利益不受损失,就是客户流失管理。客户流失管理可以划分为四个阶段——客户流失预测阶段、客户流失分析阶段、客户挽留阶段、方案评估阶段。流失预测阶段的主要工作就是借助客户流失预警模型,找出流失概率大的客户群体,列为重点关注对象。
  (二)主成分分析
  本文基于交易流水数据构造了六个维度的指标,同一维度内的指标相互之间相关性较强,直接用于建模会造成严重的共线性问题,使得模型不稳定,变量系数与实际方向甚至可能相反。因此,选择主成分分析法对指标进行降维处理。在构建完第三方支付公司商户流失风险预警指标体系后,对指标进行变量间相关性分析,通过主成分分析提取主成分,用于客户流失预测建模,以此来消除可能存在的多重共线性问题。
  (三)分类算法
  客户流失预测问题本质上是一个二分类问题,常用算法可以归纳为基于统计理论的预测和基于机器学习的预测两类。统计型算法以概率论和统计学原理为基础,常用的有回归分析、聚类分析和判别分析等。机器学习属于人工智能范畴,通过对大量样本的训练和学习寻找所需要的参数或模式,主要包括决策树、贝叶斯、人工神经网络、k近邻、支持向量机等,以及组合多个基学习器的集成学习算法。
  二 客户流失预警模型
  (一)评估指标
  文采用精确率P、召回率R、二者的综合指标 F1-score 和AUC 值来评价模型的预测性能。对于某个类别,精确率 P 衡量的是正确判定该类别的测试样本占判定为该类别的测试样本的比例,召回率R衡量的是正确判定该类别测试样本占该类别所有测试样本的比例。对于给定的混淆矩阵,前三个指标的计算公式分别为:
  定义真正类率(True Positive Rate,TPR)为预测为正且实际为正的样本占所有正例样本的比例,伪正类率(False Positive Rate,FPR)为预测为正但实际为负的样本占所有负例样本的比例。对于模型给出的每个实例为正类的概率,通过设定阈值可以将每个实例归入正类或负类,进而计算得相应的一组 TPR 与 FPR,每一组均对应 ROC 曲线上的一点。AUC 值即定义为 ROC 曲线下方的面积,AUC 值越大的分类器,正确率越高。
  (二)模型结果
  在建模准备阶段,已经通过主成分分析方法得到了 11 个相互正交的新变量,直接进行Logistic 回归不会存在多重共线性问题。模型的参数估计见表 5,可以看到,在 0.05 的显著性水平下,除去 RC6 以外,全部变量均通过了显著性检验。RC6 主要与交易活跃维度下的近 3 个月活跃天数日均交易笔数、近 3 个月累计交易笔数、近 6 个月累计交易笔数、近 9 个月累计交易笔数四个指标相关。
  对于 LightGBM 和 MLP,通过 5 折交叉验證确定最佳参数组合。选择建立三层的 MLP 模型,隐藏层包含 10 个节点。比较三个模型在测试集上的精准率、召回率、F1 值和 auc 值,可以得出结论,Logistic 回归已经能够取得较好的分类结果,auc 值在 0.83 左右;LightGBM 和 MLP 在精准率和召回率上各占优势,但从 F1-score 和 auc 值两个综合性指标来看,LightGBM 略胜一筹。但这种优势并不十分突出——LightGBM 的 auc值相对于 MLP 仅提高了不到 0.004。
  神经网络方法类似于一个黑箱,与之不同的是,我们可以直接输出 Logistic 回归模型和LightGBM 模型中各个解释变量的重要程度,如下图所示。可以看到,两种方法中第 7 个主成分都是对预测商户流失最重要的变量,RC7 主要由近 1 个月交易金额 / 近 3 个月月均交易金额、近 1 个月交易笔数 / 近 3 个月月均交易笔数两个指标解释,因此,商户流失预测需要重点关注近期内(1 个月左右)商户的交易金额和交易笔数的变化率。
其他文献
摘 要:随着新课程改革的不断实践和深入及日益更新的教学理念和信息技术的发展,当前核心素养已经成为新课程改革关注的热点,也引起了广大教师的重视。本文从目前高中英语阅读教学的现状出发,结合笔者二十多年的教学实践,对核心素养下的高中英语泛读教学如何开展做了一些新的探索与研究。  关键词:核心素养;泛读教学;阅读能力;选材实施  在大力推进素质教育的今天,英语教师应更新观念,还英语学习本来面目,在英语阅读
期刊
摘 要:课堂教学的有效性,它直接关系到课堂教学的质量。为了提高语文课堂的有效性,我们可以从教学内容的安排和选择,教学活动的设计和课堂提问等几个方面去努力。  关键词:课堂有效性;优化教学内容;鼓励学生质疑  什么是有效的语文课堂教学呢?钟启泉教授认为:“有效教学研究最终的衡量标准是“学生成长”,而这种成长将不单单用成绩高低来作为衡量标准,教学的有效性就是要关注学生的发展。有效的语文课堂教学应该是指
期刊
摘 要:我国法律对独董勤勉义务的规定较为原则,缺乏较强的可操作性。于此情况下,从实证视角研究公权力机关对独董勤勉义务的认定思路有重要意义。相比于从实证视角研究证监会(局)对独董勤勉义务认定思路的较多资料,从实证视角研究司法实践中法院对独董勤勉义务认定思路的资料较少。笔者对司法实践中22个相关判决进行了实证分析。研究表明,在法院对独董勤勉义务的判断依据方面,法院存在自由裁量行为却未滥用自由裁量权。在
期刊
摘 要:新一轮数学课程改革正在全国范围内铺开,在学生学习方式与时俱进的同时,我们数学教师的工作也有了更新的,更高的,更具体的工作,原有的教学模式已经不能适应新的要求。因此,教师必须在教学工作中多进行思考和研究,对原有教学进行改革,在实践中学习、创造、发展,这样才能适应新课标指导下的初中数学教学。  关键词:初中数学;人教版;新课标;问题情景  自从实施新课标,各地初中陆续开始使用新教材。新课标与新
期刊
摘 要:语文教育学科是实用性与人文性的高效结合,也是对学生进行德育渗透的最佳途径。在各阶段的语文教学中,教师都应将语言、生活和教材相连接以作德育渗透,让学生们不但在课本中学到知识,更能将学到的东西学以致用。文章阐述了语文教育中德育工作开展的重要性,从几个方面探究了在初中阶段的教学工作中开展德育教育的方法。  关键词:语文教育;学生;德育渗透  在《语文课程标准》中有说明:“应当进行学生道德和情操的
期刊
摘 要:随着我国教育水平的不断提高,高中教育制度不断完善,形式更加多样,其中,尤其是对高中数学课堂教学模式的改革,更是被认为是高中教育教学改革中最为重要的环节,更加灵活的教学形式及多样化的教学模式,在一定程度上使得学生更加容易的接受高中数学的内容,激发学习兴趣。本文就高中数学教学中存在的问题展开讨论,进而在此基础上对当前存在的问题提出有效的解决建议及方法。  关键词:高中数学;教学有效性;教学改革
期刊
摘 要:本文首先分析了初中化学实验探究式教学模式的构建意义,然后结合教学实际提出了初中化学实验探究教学模式的实施策略,特别指出了创新发展化学实验探究式教学模式的方案,为初中化学实验教学提供一定的参考。  关键词:初中化学;实验探究;教学模式  实验教学是初中化学科目教学中的重要组成部分,教师有必要分割出充分的课时来带领学生观摩或者亲自做化学实验,让学生能够亲身体会化学反应极其所带来的影响。在初中化
期刊
摘 要:对医疗器械产业的发展状况进行了分析,论述了医疗器械设计专业课程改革的必要性。通过对相关高校“医疗器械设计原理”课程进行调研,从课程内容、课程师资、课程管理三方面分析不足基于校企合作模式,提出了引入企业导师团队的双师制、构建新的设计方法和课程理念的相关建议。  关键词:校企合作;医疗器械设计原理;教学改革  工业4.0产业革命对医疗器械产业的发展产生了巨大影响,尤其是发达国家对中国市场的冲击
期刊
摘 要:探究式教学模式是一种在新课程教学中的重要模式与手段,在初中数学课教学中广泛应用,在实践中要基于教学目标为基础,科学合理的融合探究性教学模式。对此,在实践中教师要基于教等角三角形为基础探究合理有效的培养路径与手段。  关键词:初中数学;等腰三角形教学;探究能力;培养有效性  数学学习可以有效的拓展学生的思维能力,有利于培养学生的探究能力。在等角三角形教学中,教师要根据实际状况探究合理有效的教
期刊
摘要;中国共产党与美国政府的关系,最早见于太平洋战争时期,美国出于“先欧后亚”战略考虑,需要重新审视国共两党在对日作战中的作用,以及共产党和苏联的关系,加上中国共产党的积极推动,美国政府先后派出“美军观察组”、美国特使等,与中国共产党进行了有限的接触。但是,这种了解和接触,伴随着世界反法西斯战争的胜利和中国内战的兴起而结束,其中的教训是深刻的,其责任完全在美国方面。  关键词:太平洋战争;中国共产
期刊