论文部分内容阅读
P2P网络借贷作为小额信贷领域的一种延续和创新,是民间普惠金融和互联网金融的重要组成部分,对传统信贷业务结构构成了补充,自21世纪初出现以来在全球范围内得到高速发展。按照行业成熟度和监管力度划分,我国P2P网络借贷行业的发展大致可分为两个阶段。2007-2015年期间,国内发展普惠金融和互联网金融的需求与P2P网贷相适应,同时监管相对滞后,行业在这一阶段表现出快速而野蛮的生长态势。2015年后,我国监管持续发力,在国内外新的经济金融环境压力下,该阶段表现为“劣质平台”的淘汰和大量平台的跑路失联、停业违约,对剩余平台提出了更高的风控要求。为此,在监管趋于完善、行业趋于集中的趋势下,本文将回归微观风控,聚焦对用户的违约预警模型研究。本文在使用Logistic模型构建P2P网贷违约预警模型的基础上,尝试利用自启发的全局搜索算法——遗传算法来优化其特征工程。首先,为更全面地探索优化过程细节,以数据披露相对完备的美国Lending Club数据集为研究案例,通过数据清理和多次遗传运算获得优化模型,结果表明优化后的模型可以使原分类模型在准确率、精确率和召回率均得到显著提升。然后,为探索优化方法在国内网贷实务中的应用价值,本文进一步以国内的拍拍贷数据为研究案例,比较分析中美网贷违约风控的差异,通过实证分析,得出模型的预警效果在各项指标上得到较为明显的提升,验证了优化效果,对前文研究内容进行补充。未来的研究可以针对本文在算法综合性、违约行为多分类上的不足之处进行扩展。最后,本文通过所探究的技术应用,基于数据风控的角度,对我国P2P行业发展及监管提出以下四点建议:第一,打通平台间与平台外授信数据,防范过度授信;第二,数据开源,吸收社会算力与研究方法,增强模型精度;第三,积极创新,在传统信贷分析框架中扩展新数据维度,积极使用诸如遗传算法等机器学习算法,同时注重扩展诸如“朋友圈”、“常去地点”等新型信用分析指标;第四,推动数据立法,规范电子合同,完善网贷数据登记、披露机制。