论文部分内容阅读
P2P网络借贷作为一种新型金融模式,打破了传统借贷门槛高、手续繁琐、覆盖范围小等局限,它以“普惠”为核心思想,将互联网与民间借贷相结合,使得资金借贷双方可以通过第三方网络平台相互匹配以实现各自的借贷需求。这种交易方式不仅缓解了我国中小企业融资难、融资贵的难题,而且提高了金融服务的质量和效率,促进了我国多层次金融体系的构建。但是,P2P网络借贷在推进我国普惠金融实现的同时,也逐渐暴露出了一些问题,其中借款者借贷违约现象尤为显著。因此,对P2P网络借贷违约风险进行分析,建立合理有效的违约风险分析模型,促进P2P行业健康可持续发展已经成为金融业和学术界的研究热点。本文首先介绍了P2P网络借贷违约风险的相关理论以及借贷违约风险研究中所使用的各种方法;其次,收集了Lending Club官网上公布的历年借贷交易数据,并通过数据清洗、数据规约以及特征编码等一系列流程完成数据预处理工作,得到可以用于建模分析的数据集;然后,将最大信息系数MIC引入P2P网络借贷违约风险研究之中,构建基于最大信息系数MIC的复杂网络模型,通过调整阈值,观察网络结构变化情况,并从全局角度对借款者借贷违约可能影响因素进行研究分析;最后,根据变量间的最大信息系数MIC值,运用机器学习前沿算法LightGBM,构建基于不同数量影响因素的P2P借贷违约预测模型,并对模型的性能进行评估与对比。经过一系列的研究分析,得到以下结论:(1)最大信息系数MIC凭借其两大重要性质及适用于任意类型变量的优势,在确定所考察变量重要影响因素方面展现出较好的识别能力。(2)在P2P违约风险复杂网络模型中,随着阈值的增大,借款者借贷违约重要影响因素会被识别出来,其中重要性较强的3个影响因素分别为借款者信用子级、借款者信用等级、贷款利率。此外,利用P2P违约风险复杂网络模型,还可以观察复杂网络结构变化情况以及影响因素之间的连接情况。(3)通过比较基于不同数量影响因素的P2P借贷违约预测模型发现,影响因素数量为39的模型性能相对较好,将影响因素数量为39的模型作为最终预测模型,不仅能够识别绝大部分履约借款者,而且可以降低违约风险,减小违约率。通过对国内外学者有关P2P网络借贷违约风险研究成果的梳理和归纳,了解了该领域的研究现状与进展,在此基础之上,开拓思路,探寻问题解析的新角度、新方法。本文可能的创新点有如下两点:(1)将最大信息系数MIC引入P2P网络借贷违约风险研究之中,为违约风险模型的构建奠定基础。(2)建立复杂网络模型,考虑借款者的各类软、硬信息以及借贷申请中的借款信息,从全局角度对可能影响因素进行系统的研究分析。