论文部分内容阅读
近年来,P2P网络借贷行业发展十分迅速,成为中小微企业以及个人融资的重要渠道之一,为我国经济的快速发展带来了诸多机遇和挑战。传统的商业银行在贷款的过程之中,通过资产抵押以及调查的方法来进行借款人偿还能力和意愿的判断,以降低由于贷款人违约而可能造成的风险和损失。P2P网络借贷中的借贷行为发生在互联网的环境之中,借贷双方没有发生直接的接触,因此存在较大的信息不对称性。投资者往往由于不能够准确的判断贷款者的信用水平,而造成较大的投资风险损失,严重影响了投资者的利益。 提高互联网金融平台的风险识别能力,增强风险控制水平,是对P2P借贷平台的要求,也是目前我国互联网金融的一项核心工作。本文通过历史借贷用户的数据,利用机器学习的方法进行违约风险概率较高的用户的有效甄别,以合理的方法将借贷用户的软硬信息转化为能够衡量用户违约风险的信用评分,以期望投资者能够对借贷用户的信用风险进行有效的识别,降低投资风险。 本文以LendingClub的数据为基础,以借贷用户的借款目的、收入水平、居住地、工作年限等数据进行了违约用户的画像分析,定性地分析了借贷用户的违约风险的可能性大小。在实证过程中,本文以机器学习方法为技术手段,通过特征工程的方法进行了数据集的构建,利用逻辑回归模型进行P2P网络借贷用户的违约可能性的预测,并根据用户的违约概率计算出用户的信用评分,以期望能够直观反映P2P网络借贷用户的信用情况,展现P2P网络借贷用户的潜在违约风险。在模型构建之后,以借贷时间为依据进行训练子集和测试集的拆分,使用了KS指标和PSI指标对训练集、测试集的不同月份的数据子集区进行了模型区分效果以及稳定性的检验。最后,对训练子集分别建立逻辑回归模型,以研究随着时间的变化,参与构建模型的特征的动态变化情况。