论文部分内容阅读
在如今互联网金融时代的潮流下,随着国内银行业务范围的扩大、客户量的增长、时间的累积以及数据收集和存储技术的迅速发展,产生了一种“客户数据丰富,但知识贫乏”的现象。银行业的激烈竞争实质上是客户资源的竞争,如何挖掘庞大而多维的数据背后隐藏的潜在市场,如何发现客户的消费需求倾向,如何筛选并挽留易流失的客户等等问题,迫切需要一种能够高效、多维度、精准化的客户细分模型为银行实现企业利益最大化提供决策指导。聚类算法是客户细分中运用最为广泛的方法,然而传统的K-Means算法在实际应用中把所有属性特征按同等贡献度看待,没有考虑不同属性特征对聚类结果可能造成的不同影响,忽略了业务含义。为解决K-Means算法所导致的聚类偏差并提升聚类效果,本文在K-Means算法的基础上进行改进,通过Logistic逐步回归加权的方式筛选重要属性并赋予属性权重,使之能够按属性贡献度对数据对象进行差异化度量,从而设计一种基于属性加权的聚类算法应用到银行客户细分场景中。本文使用的是从某银行数据库和CRM系统中随机抽样的客户全年交易记录及相关信息数据,通过客户的当月AUM月日均(金融总资产)这一指标把客户分为低端客户、中端客户和高端客户三组,以为银行带来收益为主要研究目标,从客户基本属性信息、客户标识信息、客户价值信息、RFM信息、客户交易及动账最值信息五个维度实现银行客户细分,主要分为三个阶段:第一阶段,三组客户分别运用基本统计分析、趋势分析、业务分析、相关性分析等方法进行变量的选择与确定,以客户AUM资产达标为目标变量,应用logistic逐步回归模型尝试、比较及业务解读,并通过ROC曲线和Lift提升曲线的评估验证,最后得到具有可解释性、可靠的相关变量和模型系数。第二阶段,根据第一阶段所得的相关变量和模型系数使用回归权重设计的方法确定属性加权聚类算法的权重,然后应用传统K-Means算法和改进的属性加权聚类算法分别对三组客户依次进行聚类,通过两种聚类算法的可视化结果展示与比较,以及聚类算法性能对比和分离度、紧密度、CH指数和轮廓系数等有效性评价标准的评估与验证,最终证明属性加权聚类算法的优越性。第三阶段,应用基于属性加权聚类的客户细分算法,最终将银行客户细分成13个小类,对于细分结果进行客户价值分析,合理的判断出需要重点维护的高价值客户类别,需要挽留的易流失客户类别,需要重点发展的潜力客户类别和低价值可放弃的客户类别等等,并提出银行企业维护、发展客户和优化资源配置提供建议。