论文部分内容阅读
随着我国居民消费习惯的改变及互联网的发展,我国消费金融逐渐显现出巨大的发展潜力,消费贷款行业俨然成为金融市场竞争的焦点。然而,面对日益激烈的市场竞争环境,银行消费贷款营销方式需要从传统的粗放式营销向精细化、精准化营销转变。
本文以银行消费贷款业务为切入点,分析了银行消费贷款的发展现状以及银行在消费贷款营销中存在的不足,基于对机器学习理论以及国内外关于机器学习、精准营销和消费贷款相关文献的研究,提出将机器学习技术与银行大数据相结合,构建一种银行消费贷款的客户预测模型,从而帮助银行实现消费贷款的精准营销。为使研究更有代表性,以国内某商业银行S银行为例,通过分析S银行消费贷款客户的初步特征,提出了一种以客户基本信息、静态资产信息、动态交易信息等维度的41个特征构建的银行消费贷款客户预测模型。实证阶段,本文以S银行信用卡现金分期消费贷款产品为例,分别选取2018年7-12月和2019年1-3月的客户数据作为训练集与测试集,包含2186个正样本和8744个负样本。在对样本进行数据预处理和特征相关性校验后,保留39个特征作为模型的解释变量,运用逻辑回归、K最近邻、决策树和随机森林算法对模型进行训练,引入精确率、召回率、F1值、ROC曲线和AUC等模型评价指标比较各模型的预测效果,从而得出预测该产品目标客户的最优模型,并且研究模型在实际营销活动中的真实效果。
实证结果表明:逻辑回归算法训练出的模型最适用于S银行现金分期消费贷款产品目标客户的预测,其在测试集上的召回率可达96%,AUC为0.962,并且具备较好的解释性。模型中贡献度较高的变量分别是:客户是否是银行信用卡客户、拥有的信用卡张数、当前存款余额、近三个月存款均额和账户平均峰值金额,以及近6个月交易频繁程度和单笔交易金额大小等。本文同时研究了正负样本不均衡对模型的影响,得出在正负样本均衡情况下模型对正样本的预测效果最佳。在银行的实际营销场景中,营销人员对模型预测出的潜在客户进行营销,营销命中率较业务自然命中率提升了约8倍。
本文的研究为银行消费贷款领域的研究提供了新的方法和视角,具有良好的理论价值。同时,本文提出的基于机器学习进行精准营销的方法(如银行客户的画像分析、模型的特征选择、模型的训练与评估等)具有较高的通用性,不仅适用于银行的消费贷款产品,同样也能推广至银行的其他金融产品,具有较好的应用价值。
本文以银行消费贷款业务为切入点,分析了银行消费贷款的发展现状以及银行在消费贷款营销中存在的不足,基于对机器学习理论以及国内外关于机器学习、精准营销和消费贷款相关文献的研究,提出将机器学习技术与银行大数据相结合,构建一种银行消费贷款的客户预测模型,从而帮助银行实现消费贷款的精准营销。为使研究更有代表性,以国内某商业银行S银行为例,通过分析S银行消费贷款客户的初步特征,提出了一种以客户基本信息、静态资产信息、动态交易信息等维度的41个特征构建的银行消费贷款客户预测模型。实证阶段,本文以S银行信用卡现金分期消费贷款产品为例,分别选取2018年7-12月和2019年1-3月的客户数据作为训练集与测试集,包含2186个正样本和8744个负样本。在对样本进行数据预处理和特征相关性校验后,保留39个特征作为模型的解释变量,运用逻辑回归、K最近邻、决策树和随机森林算法对模型进行训练,引入精确率、召回率、F1值、ROC曲线和AUC等模型评价指标比较各模型的预测效果,从而得出预测该产品目标客户的最优模型,并且研究模型在实际营销活动中的真实效果。
实证结果表明:逻辑回归算法训练出的模型最适用于S银行现金分期消费贷款产品目标客户的预测,其在测试集上的召回率可达96%,AUC为0.962,并且具备较好的解释性。模型中贡献度较高的变量分别是:客户是否是银行信用卡客户、拥有的信用卡张数、当前存款余额、近三个月存款均额和账户平均峰值金额,以及近6个月交易频繁程度和单笔交易金额大小等。本文同时研究了正负样本不均衡对模型的影响,得出在正负样本均衡情况下模型对正样本的预测效果最佳。在银行的实际营销场景中,营销人员对模型预测出的潜在客户进行营销,营销命中率较业务自然命中率提升了约8倍。
本文的研究为银行消费贷款领域的研究提供了新的方法和视角,具有良好的理论价值。同时,本文提出的基于机器学习进行精准营销的方法(如银行客户的画像分析、模型的特征选择、模型的训练与评估等)具有较高的通用性,不仅适用于银行的消费贷款产品,同样也能推广至银行的其他金融产品,具有较好的应用价值。