论文部分内容阅读
网络借贷是一种新型的互联网金融模式。自2013年起,网贷行业在中国井喷式发展,然而随着行业规模的不断扩大,各种问题逐渐暴露,高比例的问题平台以及暴雷事件的屡屡出现,严重危害着行业的健康持续发展,合理度量信用风险刻不容缓。其中,关键的问题便是如何建立一个合理的借款者信用评级机制。作为信用风险模型中的重要因子,违约回收率1代表了投资者在违约发生后可收回余款的程度,具有重要的研究意义(BIS,2011)。一个合理的信用评级机制,要求可以有效地反映借款者的违约回收率(迟国泰等,2019;Chen et al.,2019)。目前网贷行业并没有形成一个统一的借款者信用评级机制,而且不同网贷平台之间的信用评级机制差异较大,同时也鲜有借款者信用评级机制将违约回收率纳入考虑范围。因此本文以人人贷(https://www.renrendai.com/)的网贷产品为例,选取其中已经发生违约的标的资产,首先利用违约回收率评价现有网络借贷借款者信用评级机制的有效性,然后循序渐进地建立一个基于违约回收率的因子得分K-Means聚类网络借贷借款者信用评级机制,从而实现对平台现有借款者的信用评级,并对网络借贷的信用风险管理提供理论支持。基于上述理论,本文的借款者信用评级分析与构建主要分为三步。第一步,本文采集了14558个人人贷2011年至2016年违约标的资产的样本数据,按照人人贷对借款者的信用评级将数据分为七类(AA、A、B、C、D、E、HR)。运用边界核方法和Kruskal-Wallis检验,本文发现人人贷的信用评级机制并不能在违约回收率的角度上起到区分借款者信用的作用,即不同信用等级的借款者违约回收率差异不明显,这与上文提到的违约回收率在信用评级中的重要性不符。第二步,考虑到上述人人贷评级无法区分借款者信用的主要原因是缺乏对借款者特征的合理刻画,本文进而采用现有信用评级文献中最常用的K-Means聚类方法,参考两个典型的借款者信用评分模型(FICO信用评分体系和芝麻信用评分体系),从借款者角度、网贷平台角度以及行业信用环境角度筛选出网贷借款者信用评级的15个指标,包括7个定性指标(学历、婚姻、收入、公司规模、工作年限、房产房贷、车产车贷)、7个定量指标(金额、利率、期限、还清比例、严重逾期比例、认证信息、地区人均可支配收入)以及1个区间指标(年龄)。在完成信用评级指标的筛选之后,本文对指标进行了标准化并对上述人人贷借款者数据进行了预处理,共得到13467组数据,最后用K-Means聚类算法对15个指标进行100次聚类,利用聚类质量的评价指标——轮廓系数,对比每次聚类运算的质量,从而选出最优的聚类结果。同时,在现有的网络借贷借款者信用评级研究中,K-Means聚类仅仅能够实现对数据的分类,而在判断每个类的信用评级时却缺乏统一的标准。因违约回收率是信用风险度量的三大支柱之一(BIS,2011;Chen et al.,2019),本文引入了违约回收率作为判定信用评级高低的标准。在完成对数据的重新评级后,为检验本文所建立的信用评级方法是否合理,本文再次运用了边界核方法和Kruskal-Wallis检验,证明利用K-Means聚类分析得到的各信用评级之间借款者违约回收率存在显著差异,从而解决了人人贷信用评级方法不能区分借款者违约回收率的问题。但是,该步骤得到的信用评级体系依然存在一个主要问题,即在本文基于违约回收率的K-Means聚类信用评级方法下,各个信用评级的借款者数量呈现出“倒金字塔”型(高信用评级的借款者多于低信用评级的借款者),这与信用评级高的借款者理应少于信用评级低的借款者的事实不符。第三步,基于此,本文分析“倒金字塔”型的主要原因来自于15个指标之间可能存在相关性,有较多的噪音,故本文运用因子分析对指标进行降维,得到了反映网贷借款者信用状况的6大因子(历史信用状况因子、还款能力因子、资产状况因子、工作状况因子、宏观环境因子、网贷产品因子),并在此基础之上用K-Means聚类算法进行100次聚类,利用轮廓系数,对比每次聚类运算的质量,从而选出最优的聚类结果。对于K-Means聚类对数据重新分类后的结果,本文引入了违约回收率作为判定信用评级高低的标准。实验结果发现,本文的基于违约回收率的因子得分K-Means聚类信用评级方法在违约回收率角度上同样起到了区分借款者的作用,优于人人贷的信用评级方法。同时在基于违约回收率的因子得分K-Means聚类信用评级方法下,借款者数量呈现出“金字塔”型,即信用评级越高的借款者数量越少,解决了仅基于违约回收率的K-Means聚类信用评级方法的“倒金字塔”问题。综上所述,本文最大的创新点在于将违约回收率引入到信用评级机制中,并作为判定信用评级高低的量化标准,同时本文提出了一个有效的对网贷平台现有借款者的信用评级方法,即基于违约回收率的因子得分K-Means聚类信用评级方法。