基于复合CatBoost模型的P2P网贷违约分类预测

来源 :兰州大学 | 被引量 : 12次 | 上传用户:ligang_nc2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网贷作为互联网金融领域的代表发展非常迅速,与此同时,众多风险也随之暴露,其中最主要的是信用风险(借款方违约风险)。因此,对借款方是否违约进行分类预测以及研究影响借款方违约的因素具有一定现实意义。本文选择我国上线较早且具有代表性的P2P网贷平台-人人贷作为研究对象,选择其2016年和2017年的有效历史交易数据构建二分类预测模型进行实证研究。首先,本文基于五个方面构建了19个特征,然后应用随机森林进行特征选择,依据每个特征的平均得分选择了前15个较重要的特征参与建模;其次,将不同的非均衡数据集处理方法(欠采样、过采样、欠采样过采样组合)与机器学习算法(SVM、RF、AdaBoost、XGBoost、LightGBM、CatBoost)相结合建立网贷违约分类预测模型;最后,通过对AUC值等衡量分类模型性能的指标进行对比分析,结果显示:复合CatBoost模型中的SMOTETomek-CatBoost模型相较于其它模型(SVM和复合SVM模型、RF和复合RF模型、AdaBoost和复合AdaBoost模型、XGBoost和复合XGBoost模型、LightGBM和复合LightGBM模型)具有更好的分类预测性能。通过对复合XGBoost、复合LightGBM和复合CatBoost模型的特征重要性评分结果分析,得到了7个影响借款方违约的主要因素。
其他文献
当前中国经济已经逐步进入"新常态",烟草商业企业传统的销售业务也遇到诸多困难,因此在"互联网+"的浪潮下拓展原有渠道,积极利用前沿计算机技术探索新型电子商务模式是一条必经之
对1例室间隔缺损(VSD)外科修补术后并发三度房室传导阻滞(Ⅲ°AVB)的8个月婴儿行永久起搏器植入治疗,给予围术期全面有效的护理,指出对于婴儿这一特殊群体术中、术后并发
目的1分析新鲜儿童孟氏骨折DR、MRI影像学资料,观察前臂骨间膜损伤的MRI表现及损伤范围,评估上尺桡关节分离程度和前臂骨间膜损伤程度。2探讨上尺桡关节分离程度与骨间膜损伤
统一眩光值(UGR)表征了照明装置发出的光对人眼造成不舒适感主观反应的心理参量。室内亮度过高或者亮度分布不均会引起人的不舒适感,所以准确的测量室内照明环境的统一眩光值
本文介绍了CBL教学方法在推拿学课堂中的应用情况。通过经典案例的学习,激发了中医专业五年制本科学员对推拿学课程的学习兴趣,锻炼了以发散性思维考虑临床病例的能力,并且在
目的:探讨一期后路单侧椎体截骨术治疗老年陈旧性压缩骨折合并脊柱后凸畸形的临床疗效。方法:采用回顾性研究,纳入2010年2月~2014年6月于我院行手术治疗的老年陈旧性压缩骨折
行政程序法的基本原则是行政程序理论中的一个重要问题,对行政程序立法具有重要意义.行政程序法的基本原则应包括公开原则、合法原则、公正原则、参与原则和效率原则.
英语阅读作为一项重要的语言技能,既是英语学习的目的,又是英语学习的手段。因此,英语阅读教学一直是高中英语教学的重点。《普通高中英语课程标准(实验)》和高考命题趋势对学生阅
围绕习近平总书记在推动长江经济带发展座谈会上提出能否通过综合运输解决三峡船闸“肠梗阻”的问题,在梳理长江上游综合运输格局和过闸各货类运输需求、流量流向基础上,聚焦
目的:探讨腹腔镜下选择性与非选择性贲门周围血管离断术治疗肝硬化门静脉高压症的临床疗效。方法:回顾性分析我科2010年5月至2013年12月收治的门静脉高压症病人临床资料,手术均