论文部分内容阅读
随着互联网不断发展和金融持续创新,民间小额贷款也出现了“互联网+”的形式,形成了P2P网贷模式。P2P网贷有效补足了传统银行贷款业务的不足,使无法从银行端获得贷款,但有实际融资需求的个人或企业有了融资的渠道。P2P贷款相比银行贷款具有更方便,快捷,门槛低的特点,具有很广泛的受众群体,P2P网贷平台数量,交易金额等也在前几年出现了快速增长。但是,由于P2P贷款的快速扩张,近年来我国P2P贷款行业出现了一些问题,整个P2P网贷行业出现了“爆雷潮”,P2P公司倒闭,跑路等现象频发,引起了一定的社会影响。不可否认,其中一些公司确实存在非法集资,违规操作,庞氏骗局的现象,但是也有不少P2P公司是由于贷款不良率居高不下,风控技术不成熟等原因给投资者造成了严重的损失。因此,控制贷款不良率是P2P网贷公司的核心所在,这是P2P网贷公司对投资者应尽的义务,同时也是公司长期发展下去的基础。
风险管理是金融行业的核心重点之一,不同于传统的银行零售贷款,P2P网贷的受众群体无法达到银行贷款的审批要求,通常面临的信用风险也越高,传统的银行信贷审批流程并不适用于P2P网贷行业,亟需寻求一种创新的方法来对P2P贷款的风险进行管理。值得注意的是,P2P网贷市场交易活跃,已积累了大量的样本数据,已经具备了大数据分析的基础,机器学习,人工智能等前沿技术也逐渐渗透到P2P网贷行业的风险管理中,传统的信用评分卡模型便是机器学习算法应用于风险管理的成功例子,“金融”+‘‘科技”是发展的大势所趋。
基于上述背景,本文寄希望于分析国外成熟的P2P网贷行业,通过实证研究国外P2P网贷交易数据,从而对国内市场提出一些建议。实证研究数据来源于美国最大P2P平台(LendingClub)共享的真实网贷数据,高达153维的变量,本文的研究目标为:只采用P2P贷款人贷前的信息来预测贷款人一年内的违约情况,研究的时间跨度为2016第一季度~2018第二季度,共计1116659条贷款记录。本文首先对一年期违约作明确定义,其次对贷款人的变量信息作严格的筛选,剔除贷中贷后的变量,以实现纯贷前数据与客户违约情况关系的实证研究。
同时,本文将机器学习算法与P2P贷款风险管理有效结合,采用前沿的XGBoost算法,构建P2P贷款违约预测模型。然后,本文通过专业的机器学习模型调参方式确定模型的最优参数,在模型检验时,采用ROC,KS等多种检验方式,并计算准确率,召回率等多个指标,从多角度验证xGBoost模型在P2P贷款违约预测上的性能,结果表明,贷前数据可以有效预测P2P贷款人在一年期内的违约情况,通过本文提出的模型,可以在贷款人申请贷款时,有效识别高达77%左右的一年期违约交易。同时本文也基于模型得到的变量重要性排名对违约因素作详细分析,并且发现了P2P贷款人的地区信息也是违约的一个重要因素。
最后,本文基于实证分析的结果,对我国的P2P贷款行业提出了一些建议:在数据层面,确保用户隐私不泄露的前提下,国内应鼓励各大P2P贷款平台共享其交易数据,群策群力,尽快提升我国P2P贷款风险管理水平;在政策层面,应要求P2P贷款人提供全面的信息,涵盖历史信用情况,还款能力等多方面,避免信息不对称,并且平台应作审核;在风控体系层面,国内应尽快推出权威的信用分,方便各大P2P网贷平台对贷款人实施初步的信用评估;在实施层面,贷前,贷中和贷后的风险管理应配合使用,全方位降低P2P贷款的违约率。
风险管理是金融行业的核心重点之一,不同于传统的银行零售贷款,P2P网贷的受众群体无法达到银行贷款的审批要求,通常面临的信用风险也越高,传统的银行信贷审批流程并不适用于P2P网贷行业,亟需寻求一种创新的方法来对P2P贷款的风险进行管理。值得注意的是,P2P网贷市场交易活跃,已积累了大量的样本数据,已经具备了大数据分析的基础,机器学习,人工智能等前沿技术也逐渐渗透到P2P网贷行业的风险管理中,传统的信用评分卡模型便是机器学习算法应用于风险管理的成功例子,“金融”+‘‘科技”是发展的大势所趋。
基于上述背景,本文寄希望于分析国外成熟的P2P网贷行业,通过实证研究国外P2P网贷交易数据,从而对国内市场提出一些建议。实证研究数据来源于美国最大P2P平台(LendingClub)共享的真实网贷数据,高达153维的变量,本文的研究目标为:只采用P2P贷款人贷前的信息来预测贷款人一年内的违约情况,研究的时间跨度为2016第一季度~2018第二季度,共计1116659条贷款记录。本文首先对一年期违约作明确定义,其次对贷款人的变量信息作严格的筛选,剔除贷中贷后的变量,以实现纯贷前数据与客户违约情况关系的实证研究。
同时,本文将机器学习算法与P2P贷款风险管理有效结合,采用前沿的XGBoost算法,构建P2P贷款违约预测模型。然后,本文通过专业的机器学习模型调参方式确定模型的最优参数,在模型检验时,采用ROC,KS等多种检验方式,并计算准确率,召回率等多个指标,从多角度验证xGBoost模型在P2P贷款违约预测上的性能,结果表明,贷前数据可以有效预测P2P贷款人在一年期内的违约情况,通过本文提出的模型,可以在贷款人申请贷款时,有效识别高达77%左右的一年期违约交易。同时本文也基于模型得到的变量重要性排名对违约因素作详细分析,并且发现了P2P贷款人的地区信息也是违约的一个重要因素。
最后,本文基于实证分析的结果,对我国的P2P贷款行业提出了一些建议:在数据层面,确保用户隐私不泄露的前提下,国内应鼓励各大P2P贷款平台共享其交易数据,群策群力,尽快提升我国P2P贷款风险管理水平;在政策层面,应要求P2P贷款人提供全面的信息,涵盖历史信用情况,还款能力等多方面,避免信息不对称,并且平台应作审核;在风控体系层面,国内应尽快推出权威的信用分,方便各大P2P网贷平台对贷款人实施初步的信用评估;在实施层面,贷前,贷中和贷后的风险管理应配合使用,全方位降低P2P贷款的违约率。