基于非平衡数据集的P2P网络借贷违约预测研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:qq343246680
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网络借贷是一种个人对个人的在线借款方式,相对于传统借贷模式,具有无需抵押、线上申请、放款迅速的特点。我国的P2P平台经历了一段时间的繁荣增长期,迅速成为个人融资的重要渠道之一,但“繁荣发展”的背后面临着很多的问题,使得2016年开始P2P行业频频暴雷。究其原因,一是没有健全的监管制度和法律体系导致不合规平台众多;二是没有完善的信用体系,信息不对称严重;三是很多平台没有合适的风控体系,导致用户违约率居高不下。因此如何提高平台对违约用户的识别能力,对于P2P行业的健康发展具有重要意义。一般来说,违约用户的数量要远小于正常用户的数量,所以网贷数据集是类不均衡的,如果利用传统的算法进行模型训练会产生很多问题,所以本文从不同的角度对传统算法进行了改进。从众多的学习算法中选择了逻辑回归算法、BP神经网络、E-LightGBM算法,并从解决类不均衡问题的角度对算法进行改进。从代价敏感学习的角度,提出了cost-LR算法和cost-BP算法,对逻辑回归和BP神经网络中的交叉熵损失函数加权处理,使得违约样本预测为正常样本要付出更大的代价;从数据层面出发,提出了E-LightGBM算法:利用EasyEnsemble算法的思想对多数类多次欠采样得到多个多数类子集,并与少数类相结合形成多个平衡的数据子集。最后,利用LightGBM算法去训练多个模型,并采用投票法得出最终预测结果。我们将提出的三种算法在Lending Club平台和拍拍贷平台进行实证分析,使用filter和随机森林特征重要性相结合的方式进行特征选择,使用F2分数、Gmean、Auc作为评价模型性能的指标。研究结果表明,我们所提出的三种改进算法都在一定程度上解决了类不平衡问题,其中E-LightGBM算法的性能最优。通过对中美平台的数据集的进一步探索发现,LC平台的数据集包含更完善的历史信用数据以及信用指标等,而拍拍贷则是利用用户的基本信息、社交网络信息、各种验证信息等。相关实验结果表明,三种算法在LC上的数据集的预测性能都要优于拍拍贷,因此为了促进P2P行业的健康发展,建议将P2P网贷平台接入央行信贷系统,并完善信用体系和数据的流通共享,为P2P行业的健康发展提供更有力的保障。
其他文献
高中数学是一门基础学科,是进一步学习高等数学的铺垫。由于数学具有高度的抽象性、严谨的逻辑性以及广泛的应用性等特征,因此学生的数学学习水平之间存在较大的差异性。针对
移动智能设备的广泛使用和移动通信技术的不断提升,使得用户可以在移动网络环境下随时随地分享自己的旅游经历,极大地提高了用户发表评论的积极性、增加了用户评论的即时性。海量的用户数据也为挖掘用户旅游偏好提供了更多机会,为用户制定个性化推荐内容的同时也是在为旅游服务提供商发掘潜在用户、增加营业收入。因此,学术界和工业界,都在不断采用更先进、更有效的方法来提高旅游推荐系统的效率。旅游推荐系统的研究由来已久,
物联网技术的发展及应用有力促进了社会生产力的发展,如各种智能设备加速迭代、各类智能传感器研制与综合利用、智能家居设备不断制造与更新等。但是,以上技术与产品在为人们
为了预测全国商品房销售额的变化趋势以及分析导致该变化的影响因素,利用ARIMA(1,1,3)模型对2005-2019年3月全国商品房销售额时间序列进行了拟合及预测,拟合结果和实际数据基
多无人机协同侦察监视在情报侦察、战场监视等领域有着广泛的应用,如何将多无人机部署于复杂环境中执行侦察监视任务,是一个影响多无人机应用的重要问题。侦察监视环境往往具
低维材料由于具有量子效应和表面效应,因而表现出特殊的物理、化学性能,其中量子点和团簇是两种具有特殊优良性能的低维材料。近年来,无机钙钛矿量子点CsPbX3(X=Cl、Br或I)材
同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)是机器人与自动驾驶领域中一大重要关键技术,具有非常广泛的应用前景与使用价值。由于视觉传感器和激光传
同串联与并联机构相比,混联机构兼具有运动速度高、累计误差小、承载能力强、工作空间大等其两者的优点,近年来在各领域得到了广泛应用。伴随工业科技水平的不断提升,混联机
随着飞秒激光技术的不断革新,飞秒激光在材料加工领域扮演了越来越重要的角色。飞秒激光具有超短的激光脉冲和超高的能量密度,应用于材料加工领域可将加工精度达到纳米级,可
电子转移反应广泛存在于自然界中,如线粒体的有氧呼吸,各种蛋白质的氧化还原过程等。对于电子转移的理论研究大都是基于Marcus模型,其中一个参数V12表示电子供体和受体间的电