基于集成学习的P2P网贷违约客户识别实证研究

来源 :安徽财经大学 | 被引量 : 0次 | 上传用户:or4108432566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,传统的金融业受到冲击,这样的大环境促使了P2P网络借贷平台的诞生,用户无需通过中介机构来进行借贷,直接通过互联网实现个人对个人的实行借贷行为。P2P网络借贷平台面向对象比较广泛,要求不高,操作便捷,越来越多的人选择在P2P平台进行借贷,但是随之而来的问题也逐渐开始显现。由于信息的不对称,P2P网络借贷平台很难全面掌握用户的资料,信用评估困难重重,借贷门槛低、客户资料不全面、贷款金额少、违约情况多等现象加大了进行信用评估的难度,由于借款客户每天的交易数据量巨大,传统的信用评估方式已经不适用,建立一个更高效、更精准、更客观、更低成本的信用评估系统成为难题。本文以2019年上半年Lending Club的用户数据为研究样本,以违约客户识别算法为研究对象,研究内容主要分为五个部分,第一,交代论文的研究背景以及研究的意义,总结国内外学者在P2P借贷平台违约影响因素和违约预测模型上的研究现状,介绍论文的研究框架;第二,介绍P2P网络借贷相关研究,总结P2P网络借贷平台在中国经历的各个阶段和运营模式,归纳了P2P网络借贷的主要风险,简述分类问题及集成学习不同结合策略,并详细介绍XGBoost算法、随机森林算法、投票分类算法和算法评价指标;第三,对数据进行统计分析和数据预处理;第四,运用XGBoost、随机森林、投票分类算法进行实证分析,并与其他算法进行比较、打分;第五,总结研究成果,提出相关建议。研究结果表明:在违约影响因素方面,职业、年收入、工作年限、贷款金额、贷款目的、住房拥有状态等特征变量均对客户违约风险有一定的影响,“过去12个月开设的循环贸易数目”、“贷款利率”、“抵押账户数”、“当前活跃的交易数量”等经济行为的特征贡献度比较高,在违约客户识别模型中起到非常重要的作用;在违约识别算法方面,F1得分最高的是随机森林算法(0.92955),查全率最高的是K近邻算法(0.96624),查准率最高的是XGBoost算法(0.99157),AUC值最高的是随机森林算法(0.97820)。综合评分最高的是随机森林算法,第二为XGBoost算法,第三则为投票分类算法。集成学习器性能要远远优于个体学习器,但整体运算时间较长,调参有一定难度,成本较高。根据研究成果,提出如下建议:1、完善网贷平台风险控制,科学评估客户违约风险;2、健全客户信用审核机制,加快全社会征信步伐;3、加强P2P行业管理,完善互联网金融的法律规范;4、紧跟国内互联网金融政策,明确发展方向。
其他文献
美术课堂上有效的师生互动,不仅有利于教师高效地完成课堂教学,也有利于学生更好地吸收美术知识。为了解中学美术优质课的有效师生互动,采用弗兰德斯互动分析系统作为研究工具,选取“2018年第八届全国中小学美术课现场观摩培训活动”中评选出来的中学组19节优质课为样本,在明晰了相关研究工具以及回顾了师生互动相关研究文献的基础上,根据中学美术课堂教学实际,对该工具进行了具体化定义。从现场课堂观察记录、课后分析
房屋作为地籍管理中最主要的研究对象之一,具有明显的几何特征。本文叙述了用于3DCM建模的几种方法及数据采集方式,着重讨论了基于规则几何体构建建筑物实体模型的方法,实现
<正>DB63/T 511-2005 1范围本规范规定了青海省旱地甘蓝型春油菜栽培技术。本规范适用于青海省海拔2200-2900米、坡度≤15°、耕层≥25厘米的旱作区甘蓝型春油菜栽培。
强化下渗是目前海绵城市建设的技术措施之一,利用城市绿地入渗雨水,在减少雨水径流量、削减雨水径流的污染物的同时,可以补充地下水。但由于对每次降雨事件的入渗量与径流量
本文针对当前我国城市在全球化浪潮与快速城市化背景下出现文化危机的普遍现象,剖析传统城市规划侧重物质空间形态的塑造而缺乏对城市文化的有机融入最终导致城市特色沦丧,主
近年来,农十师一八八团妇联按照"党建带妇建"的工作要求,积极探索组织建设的新思路,加强组织建设,拓宽工作领域,巩固群众基础,使基层妇联组织在构建和谐社会中充分发挥重要作
旨在开展花生种植的气候适宜性评价,以确定花生种植的气候差异格局及气候适宜性分布区域。从花生生产特性与气候因素的适宜性出发,筛选出包含温度、降雨和日照特征的6个气象
全球能源短缺危机和环境污染问题越来越受到世界各国的关注,使得大力发展和使用可再生清洁能源成为了全球能源发展的方向。风电作为最具发展前景的可再生清洁能源发电方式,近
近些年来,随着我国科学技术的不断深入与发展,神经网络在语音识别技术上运用的越来越广泛。在传统的语音识别技术中,语音建模方式是基于隐马尔科夫框架,采用混合高斯模型来描
当下的高中思想政治教学,急需构建和实施一个新的教学模式。本文结合高中思想政治教育生活化中存在的问题,构建和实施高中思想政治教育生活化教学模式,通过情景导入、探究活