P2P贷款违约预测模型的实证分析--以XGBoost算法为例

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:bbanb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网不断发展和金融持续创新,民间小额贷款也出现了“互联网+”的形式,形成了P2P网贷模式。P2P网贷有效补足了传统银行贷款业务的不足,使无法从银行端获得贷款,但有实际融资需求的个人或企业有了融资的渠道。P2P贷款相比银行贷款具有更方便,快捷,门槛低的特点,具有很广泛的受众群体,P2P网贷平台数量,交易金额等也在前几年出现了快速增长。但是,由于P2P贷款的快速扩张,近年来我国P2P贷款行业出现了一些问题,整个P2P网贷行业出现了“爆雷潮”,P2P公司倒闭,跑路等现象频发,引起了一定的社会影响。不可否认,其中一些公司确实存在非法集资,违规操作,庞氏骗局的现象,但是也有不少P2P公司是由于贷款不良率居高不下,风控技术不成熟等原因给投资者造成了严重的损失。因此,控制贷款不良率是P2P网贷公司的核心所在,这是P2P网贷公司对投资者应尽的义务,同时也是公司长期发展下去的基础。
  风险管理是金融行业的核心重点之一,不同于传统的银行零售贷款,P2P网贷的受众群体无法达到银行贷款的审批要求,通常面临的信用风险也越高,传统的银行信贷审批流程并不适用于P2P网贷行业,亟需寻求一种创新的方法来对P2P贷款的风险进行管理。值得注意的是,P2P网贷市场交易活跃,已积累了大量的样本数据,已经具备了大数据分析的基础,机器学习,人工智能等前沿技术也逐渐渗透到P2P网贷行业的风险管理中,传统的信用评分卡模型便是机器学习算法应用于风险管理的成功例子,“金融”+‘‘科技”是发展的大势所趋。
  基于上述背景,本文寄希望于分析国外成熟的P2P网贷行业,通过实证研究国外P2P网贷交易数据,从而对国内市场提出一些建议。实证研究数据来源于美国最大P2P平台(LendingClub)共享的真实网贷数据,高达153维的变量,本文的研究目标为:只采用P2P贷款人贷前的信息来预测贷款人一年内的违约情况,研究的时间跨度为2016第一季度~2018第二季度,共计1116659条贷款记录。本文首先对一年期违约作明确定义,其次对贷款人的变量信息作严格的筛选,剔除贷中贷后的变量,以实现纯贷前数据与客户违约情况关系的实证研究。
  同时,本文将机器学习算法与P2P贷款风险管理有效结合,采用前沿的XGBoost算法,构建P2P贷款违约预测模型。然后,本文通过专业的机器学习模型调参方式确定模型的最优参数,在模型检验时,采用ROC,KS等多种检验方式,并计算准确率,召回率等多个指标,从多角度验证xGBoost模型在P2P贷款违约预测上的性能,结果表明,贷前数据可以有效预测P2P贷款人在一年期内的违约情况,通过本文提出的模型,可以在贷款人申请贷款时,有效识别高达77%左右的一年期违约交易。同时本文也基于模型得到的变量重要性排名对违约因素作详细分析,并且发现了P2P贷款人的地区信息也是违约的一个重要因素。
  最后,本文基于实证分析的结果,对我国的P2P贷款行业提出了一些建议:在数据层面,确保用户隐私不泄露的前提下,国内应鼓励各大P2P贷款平台共享其交易数据,群策群力,尽快提升我国P2P贷款风险管理水平;在政策层面,应要求P2P贷款人提供全面的信息,涵盖历史信用情况,还款能力等多方面,避免信息不对称,并且平台应作审核;在风控体系层面,国内应尽快推出权威的信用分,方便各大P2P网贷平台对贷款人实施初步的信用评估;在实施层面,贷前,贷中和贷后的风险管理应配合使用,全方位降低P2P贷款的违约率。
其他文献
2008年的美国次贷危机引发了世界经济危机,为了积极应对,中国政府推出4万亿经济刺激计划,以降低危机对我国的影响。在经济刺激计划下,一些社会资金密集流入主要城市的房地产市场,一定程度上引致房地产库存积压、房价逐年走高及房企负债率居高不下等风险。我国房地产市场资金高度依赖银行贷款的状况不仅会制约房地产行业的健康发展,还容易造成金融系统风险的不断堆积。近年来,实业界主张用市场化手段化解房地产市场风险,
我国东部地区近年来面临着GDP增速放缓、适龄劳动人口数下降、劳动密集型产业活力下降、新生人口数量下降等一系列严峻的问题。“一带一路”国家级战略背景下,东部地区低端制造业逐渐向成本较低的国家外移,伴随着产业结构优化升级,受教育程度高、能够熟练运用前沿技术、具有制度适应性的高素质人力资本将对区域经济增长起到重要作用。  本文对我国东部地区经济发展、异质性人力资本现状进行比较分析,并分别构建Lucas直
学位
改革开放以来,中国经济增长迅速,创造了世界经济发展史中属于中国的奇迹。在经济发展的过程中,交通基础设施的改善为经济的发展提供了巨大的助力,也为各个地区的分工协作和交流提供了便利的条件。而高铁的建设和开通加速了这一进程,使得地域间的隔阂逐渐减少,各个地区的人们开始加速融合,行政边界对于地区之间合作的负向影响也在减弱。但随着中国经济的发展,区域之间的差距越来越大,正如十九大报告指出的,我国社会的主要矛
学位
摘要:配电自动化主要是基于一次配电网的构架、用电设备,利用通信技术、计算机信息技术和相关应用系统进行信息集成,以达到对配电网进行实时监控、快速故障隔离,遥控器配电自动化技术是城乡配电网改造工程的关键技术手段。因此,深入探讨配电网自动化技术在电力系统运行阶段的故障具有重要意义。关键词:电力系统;配电自动化;故障处理;分析研究1电力系统配电自动化常见故障1.1主变压器故障和110kV进线失压故障在供电系统中,主变压器故障主要体现在气体保护动作和主变压器差动跳闸。如果输入线电压测试失败,将发生1l0kV输入线电
期刊
2010年3月31日我国融资融券业务起正式启航,个股交易启动双边机制,凭借融资融券业务的特性,近几年得到迅速发展,两融余额在上市首日为O.06亿元,到了2018年12月31日两融余额为7557.04亿元,意味着我国证券市场发展至一个新的领域。融资融券作为信用业务对股市波动性的影响是否存在,有人认为不会产生影响,也有人认为会加剧股市的波动。针对两融业务实施降杠杆政策后,融资融券对股市风险波动的影响效
学位
本文从锌市场的角度,分析国内现货市场、国内期货市场以及国外现货市场的价格传导机制及其互相影响的程度。通过研究国外锌现货市场,国内锌期货市场以及国内锌现货市场的价格,对三个市场进行市场整合的实证分析,通过对价格时间序列构造VAR模型后使用Johansen协整检验,证明了三个市场间存在长期的协整关系。通过Granger因果检验,发现了三个不同市场之间的价格传导关系。结果得出国外锌期货市场价格可以引导国
学位
摘要:由于各種因素的存在,变电站运行常会出现状态异常,如环境因素、人为因素等,无法及时发现异常情况,可能会造成大面积停电,导致经济损失。继电保护装置发现故障后,可自动采取相关措施进行处理,同时及时上报故障信息,减少后续可能造成的损失。本文讨论了变电站运行中继电保护的几个重要问题,并提出了相应的解决方案。关键词:智能变电站;继电保护;全过程管理;措施0.引言继电保护是对变电站运行中可能发生的故障进行排除、发现系统异常、故障报警、隔离等保护措施。人民日常生活中需要电力资源。所以,加强变电站的运行保护,特别是要
期刊
摘要:配网自动化相关专业日益完善,我国电力系统的供电安全性、可靠性、供电质量、用电满意度及供配电综合管理效率均得到显著提升。但是,仍有许多配电网自动化建设项目并没有发挥预期效果,导致配电网自动化建设没有体现其应有价值。因此,有必要对配电网自动化建设及运行管理问题进行深入研究与分析,为提高我国电力系统自动化建设及运行管理水平,改善电力系统供电质量、用电满意度及供配电综合管理效率提供重要参考。本文分析了配电网自动化建设和运行管理中存在的主要问题,并提出针对性的改进措施。关键词:配网;供电质量;满意度;自动化1
期刊
我国交通运输行业近几年发展很迅速,并且我国的经济发展与交通运输行业的关系也越来越密切,交通运输行业的大力发展也大大促进了经济的进步。但是,我国对于交通运输行业与经济影响关系知之甚微,面对高速铁路的快速发展为我国所带来的影响,研究经济与交通之间的关系迫在眉睫,我们更需要正确的认识到高速铁路的发展对经济的影响,并以此更好地发展我国的交通运输行业。  本文首先对相关理论进行了介绍,主要有区域经济相关理论
随着中国私募基金飞速发展,尤其是近几年中国证券市场震荡不断,规避风险获取超额收益的私募基金逐渐引起投资者的关注。投资基金的核心是挖掘出能持续稳定产生收益的基金产品,进而发现有投资能力的基金经理人。其背后的逻辑是过往绩效表现良好的基金如果源于经理人投资能力,那么可以预期在未来一段时期内仍能获得超额收益。因此,对基金经理投资能力进行研究,进而挖掘投资能力有效的衡量指标,一则帮助投资者投资,降低盲目投资