论文部分内容阅读
对于企业来讲,客户关系己经成为企业生存发展所必须关注的问题,企业以客户为中心,不仅是要单纯的发挥主观能动性为客户提供服务,更要在客户的挖掘上下功夫,只有努力赢取客户,维持客户关系,在未来的发展道路上才能获得更多的利益。
本文从分析型CRM引入了客户分析的概念,并对客户分析的应用进行了需求分析,强调了数据挖掘在客户分析中的重要性,接着对客户分析的一个方面——客户流失分析做了深入研究。在当今通信行业中,一方面新入网客户不断增加,另一方面流失的客户也在不断的增加。与其网络和业务的先进性相比,通信行业的流失客户分析却显得相对落后,目前国内运营商的流失客户分析几乎没有,所以本文针对这些率先对客户流失进行了研究分析。主要工作如下:
结合行业数据特点,确定数据挖掘方法中最适合流失客户分析的是分类方法,并进一步确定了最符合流失客户分析的分类方法中的决策树生成算法和剪枝算法,提出了把基于概念层次的CART决策树分类算法应用到客户流失的设计思想。
根据网通公司提供的数据特点,以及经过初步处理,本文依据CRISP-DM标准过程设计并实现了“流失客户分析模型”。在数据预处理上,考虑到模型的实用性,本文采用了概念分层技术对数据进行了预处理,并使用分层抽样技术确定样本,它可以有效地增加目标群的比例,使流失客户的特征能够充分的反映出来。对于模型的核心部分,为了使发现的规则具有实际意义且不会过于细腻,本文提出了基于概念层次的CART决策树分类算法,在实现时不仅考虑了使用非递归算法以提高执行效率这一点,而且提出了一种新策略,即在为存储数据的数组中增加一列,作为索引项,以链接满足某个分割条件的记录,以此使决策树的构造更有效率。最后对生成的模型进行了评估分析,为初步研究做了总结,对未来可研究方向做了一些探索。