论文部分内容阅读
随着中国经济发展,居民收入的提高,消费金融类产品自2016年以后出现了较快的增长,按照消费支出每年增长10%、消费信贷渗透率提高到25%估计,到2020年短期消费贷款将达到10万亿以上,市场前景广阔。目前中国消费金融市场的参与者主要包括各类金融公司,竞争激烈,由于银行要求严格、申请周期较长,无法适应小额、高频次场景下消费者的即时需求。同时消费金融业务单笔金额较小,传统的授信模式所需的人力成本较高,因此风险控制成为了银行发展消费金融的主要障碍,因此如何利用先进的技术手段,提高银行对消费金融风险的控制能力,对于银行应对激烈的市场竞争,提升消费金融业务的竞争具有重要的价值。
本文在分析当前中国银行业消费贷款业务发展,信用风险控制的基础上,对A银行当前信用风险控制中存在的不足进行了分析。为了改进当前信用风险控制,本文使用Stacking组合模型方法,对BP神经网络、逻辑回归、决策树等效果一般的模型进行组合,并使用A银行的数据进行实证分析,对比各个模型的效果。
本文的结论有:(1)A银行个人消费贷款的不良率从2012年的0.41%增长到2018年的1.67%,在个人消费贷款增长的同时,不良率增长较快,从风险管理的手段来看,A银行的个人消费贷款风险管理手段显得比较单一,信用指标体系有限,量化方法不足,无法有效刻画客户信用风险等问题;(2)本文在文献及理论研究的基础上,设计了5个维度22个指标。其中5个维度包括基本信息、历史交易信息、贷款情况、还款能力、征信信息等维度。基本信息维度包括年龄、性别、婚姻、子女数、教育程度、职业、职位等指标;历史交易信息维度包括过去6个月平均交易笔数、过去6个月平均交易金额、过去12个月平均交易笔数、过去12个月平均交易金额等指标;贷款信息维度包括贷款金额、贷款期限、贷款利率、是否有担保品、还款方式、历史逾期次数等指标;还款能力维度包括年收入、各项资产余额、消费支出、各项收入等指标;征信信息维度包括过去6个月新开账户个数、征信情况等指标;(3)为了优化信用风险预测模型,本文构建了Stacking组合模型,将决策树模型以及BP神经网络模型作为第一层基础预测模型,然后使用逻辑回归进行第二层预测。本文采用R语言的caretEnsemble包实现Stacking模型,caretEnsemble中的caretStack函数能够基于不同学习器进行Stacking组合;(4)为了验证模型的有效性,本文使用A银行的数据进行实证分析,得到单独使用逻辑回归、BP神经网络、决策树的准确率都不太高。单独使用逻辑回归时,该模型在正样本的准确率为82.7%,在负样本的准确率为81%,整体准确率为82.3%;单独使用BP神经网络时,该模型在正样本的准确率为84.3%,在负样本的准确率为85%,整体准确率为84.5%;单独使用决策树时,该模型在正样本的准确率为81%,在负样本的准确率为79%,整体准确率为80.5%。通过对模型进行Stacking组合,可以看到组合模型在正样本的准确率为94%,在负样本上的准确率为95%,整体准确率为94.25%。通过Stacking对几个效果不太好的模型进行组合,较大的提高了模型的预测性能;(5)本文对信用风险具有较大影响的变量进行了分析,从重要排名来看,影响最大的变量是消费支出,该变量与信用违约存在正向关系,影响系数为0.3329,各项资产余额与信用风险存在一定的负向关系,影响系数为-0.3231;过去6个月平均交易笔数与信用违约存在负向关系,影响系数为-0.3021;各项银行卡收入与信用违约存在负向关系,影响系数为-0.2951;征信情况与信用风险存在负向关系,影响系数为-0.2862;历史逾期次数与信用风险存在正向关系,影响系数为0.2014;过去6个月平均交易金额与信用风险存在负向关系,影响系数为-0.1924;贷款利率与信用风险存在一定的负向关系,影响系数为-0.1311;
本文的研究对于银行提升消费贷款的信用风险控制能力,进而提升银行在消费金融产品市场的竞争力具有一定的参考价值。
本文在分析当前中国银行业消费贷款业务发展,信用风险控制的基础上,对A银行当前信用风险控制中存在的不足进行了分析。为了改进当前信用风险控制,本文使用Stacking组合模型方法,对BP神经网络、逻辑回归、决策树等效果一般的模型进行组合,并使用A银行的数据进行实证分析,对比各个模型的效果。
本文的结论有:(1)A银行个人消费贷款的不良率从2012年的0.41%增长到2018年的1.67%,在个人消费贷款增长的同时,不良率增长较快,从风险管理的手段来看,A银行的个人消费贷款风险管理手段显得比较单一,信用指标体系有限,量化方法不足,无法有效刻画客户信用风险等问题;(2)本文在文献及理论研究的基础上,设计了5个维度22个指标。其中5个维度包括基本信息、历史交易信息、贷款情况、还款能力、征信信息等维度。基本信息维度包括年龄、性别、婚姻、子女数、教育程度、职业、职位等指标;历史交易信息维度包括过去6个月平均交易笔数、过去6个月平均交易金额、过去12个月平均交易笔数、过去12个月平均交易金额等指标;贷款信息维度包括贷款金额、贷款期限、贷款利率、是否有担保品、还款方式、历史逾期次数等指标;还款能力维度包括年收入、各项资产余额、消费支出、各项收入等指标;征信信息维度包括过去6个月新开账户个数、征信情况等指标;(3)为了优化信用风险预测模型,本文构建了Stacking组合模型,将决策树模型以及BP神经网络模型作为第一层基础预测模型,然后使用逻辑回归进行第二层预测。本文采用R语言的caretEnsemble包实现Stacking模型,caretEnsemble中的caretStack函数能够基于不同学习器进行Stacking组合;(4)为了验证模型的有效性,本文使用A银行的数据进行实证分析,得到单独使用逻辑回归、BP神经网络、决策树的准确率都不太高。单独使用逻辑回归时,该模型在正样本的准确率为82.7%,在负样本的准确率为81%,整体准确率为82.3%;单独使用BP神经网络时,该模型在正样本的准确率为84.3%,在负样本的准确率为85%,整体准确率为84.5%;单独使用决策树时,该模型在正样本的准确率为81%,在负样本的准确率为79%,整体准确率为80.5%。通过对模型进行Stacking组合,可以看到组合模型在正样本的准确率为94%,在负样本上的准确率为95%,整体准确率为94.25%。通过Stacking对几个效果不太好的模型进行组合,较大的提高了模型的预测性能;(5)本文对信用风险具有较大影响的变量进行了分析,从重要排名来看,影响最大的变量是消费支出,该变量与信用违约存在正向关系,影响系数为0.3329,各项资产余额与信用风险存在一定的负向关系,影响系数为-0.3231;过去6个月平均交易笔数与信用违约存在负向关系,影响系数为-0.3021;各项银行卡收入与信用违约存在负向关系,影响系数为-0.2951;征信情况与信用风险存在负向关系,影响系数为-0.2862;历史逾期次数与信用风险存在正向关系,影响系数为0.2014;过去6个月平均交易金额与信用风险存在负向关系,影响系数为-0.1924;贷款利率与信用风险存在一定的负向关系,影响系数为-0.1311;
本文的研究对于银行提升消费贷款的信用风险控制能力,进而提升银行在消费金融产品市场的竞争力具有一定的参考价值。