论文部分内容阅读
近年来随着我国经济的转型升级,消费金融业的发展越来越迅速,信用卡己然成为银行收入的主要来源。在如今国内信用卡业务发展的迅猛态势下,各家银行不断增加信用卡的发行数量,推出各种优惠的卡种,以此来保持一定的市场占有率,获得更高的收入。所以这就导致了“一人多卡”的现象,即一个持卡人拥有多张卡片,却不会去激活使用,这不仅造成信用卡激活率不高,而且给银行带来不必要的损失。纵观如今的国内信用卡市场,各家银行之间的激烈竞争愈演愈烈,卡产品同质性较强,加之各家银行的睡眠卡率居高不下,粗放式营销己然过时,银行急需引入信息技术来挖掘客户的真正需求。基于上述现象,本文从银行角度出发,建立信用卡新卡激活模型,通过对客户信息的分析,预测该客户未来是否会激活信用卡,一方面可以降低激活率低的客户的申卡通过率,另一方面可以向激活率大的客户群进行精准营销,提高整体的卡片激活率,减少不必要的损失。由于国内外少有新卡激活模型的研究,本文参考信用卡评分模型建立激活模型,主要工作如下:1、本文通过介绍信用卡的发展历程、分析国内信用卡市场现状以及申请人申卡步骤、银行审核的流程,引出了建立信用卡新卡激活模型的必要性和实际意义,以及新卡模型建立后可以在银行应用的具体步骤。2、基于银行的实际需求,提出搭建新卡模型所需要的六个具体步骤。包括:数据获取、探索性分析+数据清洗、变量分箱、变量选取、模型架构和模型验证。其中对于入模变量的选取,本文从定性变量和定量变量两个方面考虑:对于定性变量,首先进行变量分箱,并计算分箱后WOE和IV值;对于定量变量,采用逐步回归法以及Lasso回归选取变量。3、对于模型的具体架构,本文选取2013年某段时间的商业银行信用卡客户的19980条真实数据,经过脱敏感信息处理后,包括客户基本信息、贷款明细、贷记卡明细、人行查询等。利用R软件,依次进行数据的缺失值处理、指标的初步处理、变量分箱等,并基于10折交叉验证,综合运用三种统计学的方法建立模型(主成分分析法+逐步回归+逻辑回归、lasso回归+逻辑回归和lasso回归+主成分分析+逻辑回归法),分别进行模型拟合的显著性检验,并通过Gain和Lift图对模型进行评价,最后用验证数据进行验证,得出预测效果最好的建模方法。结果表明,主成分分析法+逐步回归+逻辑回归方法对变量的筛选结果以及模型拟合预测的效果最好。本文以某商业银行数据为例建立的新卡激活模型,在实际中有很高的应用价值,提前预知客户激活率,并依此细分客户群体,可以对不同的群体采用不同的营销策略和产品定制方案,提高整体激活率和使用率,增加银行利润。