论文部分内容阅读
银行是一个特殊的金融机构,它不仅是货币存储与交易的场所,更是与国民经济息息相关的服务机构。近年来,商业银行之间的竞争逐渐升级,以及各种新型支付方式不断涌现给银行带来外部压力,银行客户的流失情况凸显,开发新客户也存在着重重困难,如何保留既有客户成为关注要点。在新业务尝试和新服务模式探索中,银行不断尝试将业务与技术相结合,挖掘信息背后的潜力,用户画像就是重要研究方向之一。本文选用某银行的客户数据,从客户流失角度出发建立客户画像体系,针对流失问题进行客户研究。本文所作的主要工作包括:(1)通过对原始数据的统计分析,了解原始数据的结构和特点,发现流失客户样本占比较少,数据存在严重不平衡现象,这将会影响分析结果,因此,采用SOMTE算法对原数据进行过采样,使数据平衡。为了让算法更好的处理数据,本文采用独热编码处理分类数据,采用MIN-MAX标准化处理数值数据。(2)分别建立七种分类模型对客户流失进行预测。为了防止模型过拟合采用十折交叉验证划分样本训练集和测试集;为了进一步优化模型结构,采用网格搜索方法进行模型参数选取。在对比模型各项评价指标得分后,选取表现最优的XGBoost作为最终的流失预测模型。(3)之前针对流失问题,大部分学者只进行流失预测,本文则站在画像的角度针对流失客户特性进行进一步的分析。因此,最后,根据预测结果,从客户的属性、银行的业务角度分别建立了属性标签和规则标签。同时,参考经典客户分析模型RFM的思路,通过主成分分析和K-Means聚类算法,建立了六种抽象化标签,即重点保持客户、重点挽留客户、重点发展客户、一般保持客户、一般挽留客户和一般发展客户。这类标签从价值、风险等方面概括了客户的特点,与传统的用户标签相比,更简单且更易于理解。由本文的数据分析可知,该银行重点挽留客户数占比较多,说明该银行有大部分具有高价值、高潜力的客户处于流失的边缘,这势必影响该银行今后的发展。所以,银行的相关工作人员应该根据这些客户的特点对其进行精准的服务,以达到挽留客户、实现利益最大化的目标。