论文部分内容阅读
《新巴塞尔协议》将违约损失率纳入银行监管资本的计量框架之中,使得违约损失率成为信用风险管理领域的一个重要研究课题。同时,违约损失率的准确预测,对银行保证资本充足、维持金融体系的稳健都有着重要作用。本文采用多任务学习方法,希望能提高违约损失率预测的准确性。
本文选取了美国著名网络借贷平台Lending Club官方网站所提供的2013年-2016年的贷款数据,包括借款人的身份信息、财务信息以及贷款信息等,对违约损失率和违约概率两个任务进行学习。只保留贷款状态为贷款注销和完全还款两种状态的样本数据,剔除正在还款中以及逾期还款等中间过渡状态的样本。将贷款注销的样本定义为违约概率预测任务的正样本,完全还款的样本定义为负样本,并对贷款注销的样本计算其违约损失率,作为违约损失率预测任务的目标变量。
本文主要针对违约损失率预测任务的数据稀缺以及现有计量模型有限等问题,提出将多任务学习方法同时用于违约损失率和违约概率的预测中,希望能提高对违约损失率的预测精度。本文主要建立了神经网络硬参数共享的多任务学习模型,同时与线性回归、逻辑回归和单任务神经网络模型相比较,评估各个模型对违约损失率预测的效果。本文通过L1正则完成初步的特征选择,同时探究了多任务学习神经网络中两个任务损失函数权重之比对模型评估结果的影响,最后经过仔细调优,得到了最终的模型评估结果。本文研究结果表明,将违约概率预测任务作为辅助任务,利用多任务学习神经网络模型,可以在一定程度上提高违约损失率的预测精度。两个任务同时训练,使得违约损失率预测任务可以多利用两部分信息,一是贷款状态为完全还款的大量样本数据,这在单独的违约损失率预测任务中是无法利用的;二是违约损失率预测和违约概率预测两个任务的相关性中所包含的丰富信息。
本文选取了美国著名网络借贷平台Lending Club官方网站所提供的2013年-2016年的贷款数据,包括借款人的身份信息、财务信息以及贷款信息等,对违约损失率和违约概率两个任务进行学习。只保留贷款状态为贷款注销和完全还款两种状态的样本数据,剔除正在还款中以及逾期还款等中间过渡状态的样本。将贷款注销的样本定义为违约概率预测任务的正样本,完全还款的样本定义为负样本,并对贷款注销的样本计算其违约损失率,作为违约损失率预测任务的目标变量。
本文主要针对违约损失率预测任务的数据稀缺以及现有计量模型有限等问题,提出将多任务学习方法同时用于违约损失率和违约概率的预测中,希望能提高对违约损失率的预测精度。本文主要建立了神经网络硬参数共享的多任务学习模型,同时与线性回归、逻辑回归和单任务神经网络模型相比较,评估各个模型对违约损失率预测的效果。本文通过L1正则完成初步的特征选择,同时探究了多任务学习神经网络中两个任务损失函数权重之比对模型评估结果的影响,最后经过仔细调优,得到了最终的模型评估结果。本文研究结果表明,将违约概率预测任务作为辅助任务,利用多任务学习神经网络模型,可以在一定程度上提高违约损失率的预测精度。两个任务同时训练,使得违约损失率预测任务可以多利用两部分信息,一是贷款状态为完全还款的大量样本数据,这在单独的违约损失率预测任务中是无法利用的;二是违约损失率预测和违约概率预测两个任务的相关性中所包含的丰富信息。