论文部分内容阅读
近年来,个人互联网贷款定价问题是许多金融体系重点研究的问题,关系到贷款双方的利益问题,是新型的互联网时代商业模式的新问题,相关的贷款定价技术也在不断取得进步,许多科学先进的贷款定价模型也如雨后春笋般涌现,相关的研究已经取得许多进展。
贷款定价是商业银行根据自身资金成本、盈利目标以及贷款风险和期限,结合借贷市场资金供求状况和用户的贷款情况后才做出的定价决定。为了针对不同的用户群体,根据其个人互联网消费的贷款情况和用户的个人情况,通过设计出一个合理的模型针对不一样的贷款用户进行风险等级的评定,并结合其他的可选参数共同设计出一个尽量精确的分类模型,为用户匹配出个性化的贷款定价服务,以实现双方经济效益最大化,这具有非常大的实际意义。
做个人互联网贷款定价研究,是互联网贷款在各大互联网行业中获得相对优势的重要条件,该研究在一定程度上有利于我国贷款产业中的资本调度和资源分配,同时,也有利于借贷平台进一步开拓金融市场。从传统模型的研究中不难看出,贷款利率的波动对贷款双方经济效益产生了深远影响。传统的模型或研究方法主要是基于贷款利率、个人收入和风险控制、市场制度等因素对贷款定价进行分析,本文针对个人互联网消费贷款使用了机器学习和大数据的技术进行建模,为影响贷款定价的主要因素做出了多角度分析,提出了适用于该应用的A-Kmeans聚类模型和混合结构为VGG19接入10层DenseNet结构和6层ResNet的分类模型,分别来解决用户风险定级问题和贷款定价问题。
A-Kmeans聚类模型由AutoEncoder的数据降维和Kmeans聚类阶段组成,使用数据降维操作是为了能够将主要的数据特征进行压缩,以使得Kmeans算法能在低维空间中进行聚类,效果也相比于只使用Kmeans算法进行聚类高出近4个百分点;同时,为了实现模型对数据的拟合性,并且提高参数共享性,在AutoEncoder的自编码器中也使用了10层DenseNet结构和6层ResNet结构作为编码器和解码器,如此可以与数据分类模型中的这部分结构进行参数共享,最大程度上保证了在同一组数据中的模型共享性。模型当中使用VGG19的结构是为了能够轻便的提取数据特征;使用DenseNet连接机制是为了降低模型的复杂度、减少参数量、提高参数的共享性,缓解模型的梯度消失问题;使用ResNet是为了能够将重要数据特征进行规范化,使得模型的输出更贴近于分类数。论文在此基础上研究了与贷款定价和风险评估有关的主要因素有哪些,为客户的贷款业务提供个性化的定价服务,并在这个基础上将各个字段参数的作用结果进行可视化,清晰得出影响风险评估相关的字段参数之间的关系。
以mAP指标作为评价模型的准确度指标,实验结果表明,在数据降维问题上使用的AutoEncoder模型实现94.5%的准确度,较PCA模型和LDA模型高出近5个百分点;在风险评级问题中使用的Kmeans模型实现88.3%的准确度,较Pmeans和DBSCAN模型高出近3个百分点;在贷款分类问题中使用的VGG19-10D-6R模型实现87.9%的准确率,较其他的特征提取器的准确率相当,但参数量小了近10MB大小,测试耗时短近10ms。DenseNet和ResNet结构的层数设计进行对比,贷款定价分类数进行对比,风险评级模型和贷款定价模型的分类数进行对比,发现10层DenseNet结构和6层ResNet结构作为分类器和编码器的效果较其他结构的准确率高近1个百分点,使用2个贷款分类数准确度高近2个百分点,参数量小近4MB,使用5个风险等级类高出近1个百分点,参数量小近5MB。本次实验发现影响风险评级的主要因素是贷款是否逾期与名下账户状态两个因素,影响贷款定价分类的因素主要是缴存基数和缴费工资两个因素。通过搭建科学的反馈系统,实时地获取到客户的反馈信息,不断地优化论文的模型,网络结构的泛化能力较强,模型表现优异,将来若模型可被部署在云服务器上,通过APP平台实时收集受贷客户的数据,并给出合理的贷款定价,同时根据定价结果及时反馈给模型新的数据信息以升级模型。
贷款定价是商业银行根据自身资金成本、盈利目标以及贷款风险和期限,结合借贷市场资金供求状况和用户的贷款情况后才做出的定价决定。为了针对不同的用户群体,根据其个人互联网消费的贷款情况和用户的个人情况,通过设计出一个合理的模型针对不一样的贷款用户进行风险等级的评定,并结合其他的可选参数共同设计出一个尽量精确的分类模型,为用户匹配出个性化的贷款定价服务,以实现双方经济效益最大化,这具有非常大的实际意义。
做个人互联网贷款定价研究,是互联网贷款在各大互联网行业中获得相对优势的重要条件,该研究在一定程度上有利于我国贷款产业中的资本调度和资源分配,同时,也有利于借贷平台进一步开拓金融市场。从传统模型的研究中不难看出,贷款利率的波动对贷款双方经济效益产生了深远影响。传统的模型或研究方法主要是基于贷款利率、个人收入和风险控制、市场制度等因素对贷款定价进行分析,本文针对个人互联网消费贷款使用了机器学习和大数据的技术进行建模,为影响贷款定价的主要因素做出了多角度分析,提出了适用于该应用的A-Kmeans聚类模型和混合结构为VGG19接入10层DenseNet结构和6层ResNet的分类模型,分别来解决用户风险定级问题和贷款定价问题。
A-Kmeans聚类模型由AutoEncoder的数据降维和Kmeans聚类阶段组成,使用数据降维操作是为了能够将主要的数据特征进行压缩,以使得Kmeans算法能在低维空间中进行聚类,效果也相比于只使用Kmeans算法进行聚类高出近4个百分点;同时,为了实现模型对数据的拟合性,并且提高参数共享性,在AutoEncoder的自编码器中也使用了10层DenseNet结构和6层ResNet结构作为编码器和解码器,如此可以与数据分类模型中的这部分结构进行参数共享,最大程度上保证了在同一组数据中的模型共享性。模型当中使用VGG19的结构是为了能够轻便的提取数据特征;使用DenseNet连接机制是为了降低模型的复杂度、减少参数量、提高参数的共享性,缓解模型的梯度消失问题;使用ResNet是为了能够将重要数据特征进行规范化,使得模型的输出更贴近于分类数。论文在此基础上研究了与贷款定价和风险评估有关的主要因素有哪些,为客户的贷款业务提供个性化的定价服务,并在这个基础上将各个字段参数的作用结果进行可视化,清晰得出影响风险评估相关的字段参数之间的关系。
以mAP指标作为评价模型的准确度指标,实验结果表明,在数据降维问题上使用的AutoEncoder模型实现94.5%的准确度,较PCA模型和LDA模型高出近5个百分点;在风险评级问题中使用的Kmeans模型实现88.3%的准确度,较Pmeans和DBSCAN模型高出近3个百分点;在贷款分类问题中使用的VGG19-10D-6R模型实现87.9%的准确率,较其他的特征提取器的准确率相当,但参数量小了近10MB大小,测试耗时短近10ms。DenseNet和ResNet结构的层数设计进行对比,贷款定价分类数进行对比,风险评级模型和贷款定价模型的分类数进行对比,发现10层DenseNet结构和6层ResNet结构作为分类器和编码器的效果较其他结构的准确率高近1个百分点,使用2个贷款分类数准确度高近2个百分点,参数量小近4MB,使用5个风险等级类高出近1个百分点,参数量小近5MB。本次实验发现影响风险评级的主要因素是贷款是否逾期与名下账户状态两个因素,影响贷款定价分类的因素主要是缴存基数和缴费工资两个因素。通过搭建科学的反馈系统,实时地获取到客户的反馈信息,不断地优化论文的模型,网络结构的泛化能力较强,模型表现优异,将来若模型可被部署在云服务器上,通过APP平台实时收集受贷客户的数据,并给出合理的贷款定价,同时根据定价结果及时反馈给模型新的数据信息以升级模型。