基于机器学习的信用借贷风险分析与评估研究 ——以Lending Club为例

来源 :厦门大学 | 被引量 : 0次 | 上传用户:dapeng0429
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的发展,个人信用在经济社会占据越来越重要的地位。我国信用评级起步较晚,且使用的范围较窄,与国外信用评级发展相比之下也有很大的差距。相比传统信用贷款,我国的P2P网络信用借贷近年来快速发展,满足了更多人的贷款需求。P2P网络信用贷款平台展现了我国未来金融机构的发展方向,但在信用借贷风险评估体系与监管方面有着重大的挑战。本文主要研究当下极具代表性的P2P网络信用借贷平台Lending Club,Lending Club作为全球首个上市的P2P网络信贷平台,它运转高效且有着完善的信用评分体系,经过十多年发展已成为全球最大的P2P网络信贷平台。本文收集了 Lending Club用户从2007年到2015年的信用贷款数据集,首先通过用户在约定时间内完全偿还贷款和无法偿还而成为坏账这两种典型的信用贷款状态来分析用户贷款时候提供的个人属性、个人属性与贷款状态的关系以及个人属性之间的相关性。然后通过数据集属性的缺失、用户属性的定性定量之间转换、相关属性筛选等对用户的数据集进行清洗,并划分数据集和对其进行标准化。最后使用朴素贝叶斯分类器、逻辑斯蒂回归、线性支持向量机、fisher线性分类器、BP神经网络、CART分类树以及XGBoost模型对划分的数据集进行训练和预测,分析用户贷款状态是好账还是坏账,为是否发放贷款提供评估结果作为参考。本文通过了准确率、精确率、召回率、AUC等多个角度,对比几种机器学习模型在Lending Club用户的数据集上的表现。最后基于Lending Club认定的用户等级划分了更易分类的用户数据集,再使用机器学习模型进行评估,提升模型的预测效果,并与之前的数据集进行对比讨论结果。为我国构建与完善个人信用借贷风险评估提供参考方法,为我国经济发展提供助力。本研究也存在不足之处,没有采用其他贷款状态的Lending Club用户数据分析,还有对于缺失值的处理、属性相关性处理等都会对预测用户的贷款状态结果产生影响。另外Lending Club中也存在“好账”和“坏账”用户的各属性值相似,导致分类模型对部分数据难以做出正确区分,对预测的准确率等造成影响,希望在以后的研究中能够克服这些困难。
其他文献
目的:运用中医传承计算平台V3.0(Traditional Chinese Medicine Inheritance Calculate System V3.0,TCMICS V3.0)对周亚滨教授治疗不稳定型心绞痛(Unstable angina,UA)的病例进行收集并进行用药数据分析,探讨周亚滨教授治疗UA的用药规律,为临床治疗UA提供思路及方法。方法:通过收集周亚滨教授于2016年11月至2
<正>纤维素是地球上最丰富的可再生植物资源,近年再生纤维素新材料已十分引人注目。首先,我们利用碱-尿素-水体系制备得到纤维素溶液,用少量化学交联剂制得含少量化学交联点的凝胶[1]。该凝胶在酸溶液中快速诱导产生纳米纤维及物理交联网络,由此得到高强、高韧、双交联纤维素水凝胶。该水凝胶在外力作用下,大的化学交联网络保证凝胶较大的弹性,而物理交联网络的断裂和重排有效耗散能量,赋予高强度。该凝胶在外力作用下
实行家园合作对幼儿身心健康的成长和发展有着重大意义,既能促进家长资源的有效开发,也能推动幼儿园教师和家长的沟通,从而形成教育合力,使幼儿教师和家长共同参与幼儿的保教活动,为幼儿的健康成长而群策群力。而在日常的家园互动中却面临家园沟通机会少、亲子活动参与率低、保教工作不支持等诸多问题与障碍,因此,本研究尝试从树立正确的教育理念、掌握恰当的合作方式、丰富和拓展合作渠道等方面来探讨积极实现家园共育的策略
我国倡导振兴实体经济,国内各个地区的工业化程度越来越高。区域内工业化发展以及带来的经济水平发展迅速,伴随着国民经济的发展而来的环境污染问题也越来越严重。以北京为中心的京津冀发展经济圈,经济快速发展带来的负面影响有目共睹,环境污染特别是大气污染的问题积微成著。城市间大气污染的相互关系和造成这种关系的影响因素是多方面的,为贯彻区域协同治理方针,研究京津冀及周边城市群的大气污染空间关联效应和区域污染影响
<正>钒,因其被发现时呈现五光十色,而被冠以北欧女神凡娜迪斯(Vanadium)的殊名。在储能市场愈发强调“安全第一”的当下,钒一路爆火。“风光电”产业、新能源、原料……在市场高敏感的储能领域,这些关键因素的变化往往牵一发而动全身。过去的一年,在能源危机、材料价格高涨、减碳步伐加快的多重效应下,
期刊
从区域生态系统综合评估视角,对赤水河流域2001—2020年生态格局、质量和功能现状和变化特征开展定量评估,并耦合社会经济指标,识别了流域生态保护特点和空间分异规律。结果表明,赤水河流域上、中、下游各子流域在各评估指标中都表现出了明显的梯度变化特征,其中,流域下游生态本底最好,中游其次,上游最差。具体来看,流域下游生态格局和功能较为稳定,并且呈现稳中向好的变化特征,例如位于下游的大同河子流域以森林