论文部分内容阅读
作为客户关系管理中很重要的一部分,客户流失管理正越来越受到企业的关注和重视。客户流失预警作为一种有效的客户流失管理方法,通过构建预警模型,对潜在流失客户进行预测分析,及时预警并采取相应挽留措施,可以有效减少不必要的客户流失,一定程度上减少企业损失。通信运营企业有数量庞大的客户群,因此拥有丰富的客户数据,同时对客户流失预警管理有强烈的需求。在这样的背景下,本文提出了基于数据挖掘的通信客户流失预警模型研究,结合数据挖掘从海量数据中提取有效信息的能力,通过构建模型对通信客户的潜在流失行为进行预警研究。本文在研读了国内外学者的研究成果之后,对近年来预警模型的构建和数据挖掘算法在模型构建中的应用进行了综述和总结。并对客户流失概念、数据挖掘相关理论和预警模型构建相关技术进行了介绍,奠定本文的理论研究基础。在模型数据准备方面,本文以某市通信运营企业客户数据为实证研究对象,主要从无用特征删除、缺失值填充、数据离散化、非均衡数据均衡化四个方面进行方法探讨和实际操作处理,确保了模型构建的较高的数据质量。在关键特征选择方面,针对通信客户数据的特征维度高的特点,对比分析了卡方检验、主成分分析以及Fisher比率三种常用的关键特征选择方法的效果。对比实验结果发现,基于不同算法的流失预警模型在采用不同的关键特征选择方法时会得到不同的预测效果,相比较而言,Fisher比率筛选更优化特征子集的能力比卡方检验和主成分分析更强,对于基于不同算法的流失预警模型都能得到更好的预测效果。在预警模型构建方面,本文提出构建通信客户流失组合预警模型。相较于一般的组合预警模型,本文加入了基于Fisher比率的特征选择步骤,根据各单项预警模型的最佳特征子集优化训练集。选用C5.0决策树、BP神经网络、支持向量机(SVM)三种数据挖掘算法构建基本通信客户流失预警模型,利用拉格朗日函数求解得到使组合预警与各单项预警偏差最小的最佳组合流失预警模型权重,根据权重线性组合三个基本预警模型的预测结果来构建组合流失预警模型,在此基础上得到通信客户流失组合预警模型的预测结果。实证结果表明,组合流失预警模型比各单项基本流失预警模型预测效果更好,可以一定程度上减少通信运营企业的收入损失。