基于LightGBM算法的个人信用风险评估研究

来源 :华南理工大学 | 被引量 : 3次 | 上传用户:matianxiang87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临以及信贷行业的快速发展,金融机构之间的竞争变得愈发激烈。商业银行在金融体系中占据重要的地位,信用风险成为影响商业银行自身发展稳定的主要因素。个人信用评估模型的建立,可以帮助商业银行快速处理大量的信贷申请,减少运营成本。因此,本文旨在构建有效的个人信用评估模型,对比分析一些主要的信用评估模型方法和机器学习方法特点,帮助商业银行更好地对信用风险进行管理。本文研究的数据集来源于国内某商业银行真实信贷数据,包括用户基本信息、借贷信息等。在前期准备中,对借款人相关信息做描述性统计分析、数据清理工作和特征工程如:剔除异常数据、缺失值填充、特征变量衍生等。然后,运用逻辑回归、支持向量机、随机森林、XGBoost和Light GBM五种不同的算法,分别构建个人信用风险评估模型,并对模型进行调参,利用AUC(Area Under Curve)值、召回率等指标对模型进行评估分析。此外,将表现效果最佳的Light GBM输出特征重要性并排序。最后,针对于数据不均衡的问题,利用过采样、欠采样和组合采样方法对数据进行处理,探究不同采样技术对Light GBM模型效果的影响。本文得出如下结论:1、五种模型的AUC值均大于0.75,说明这五个模型都能够利用多维度数据有效地对违约行为进行识别。2、Light GBM在个人信用风险评估中有较好的应用效果,其AUC值为0.8953,召回率、F1值和运行速度均高于其他模型。3、申请时段、工作类型、年龄及贷款产品对Light GBM模型贡献度大,在商业银行的信贷业务场景中,应该重点关注这些变量指标。4、Tomeklinks欠采样、随机过采样这两种对不平衡数据的处理方法在一定程度能够提升Light GBM测试集的AUC值。
其他文献
本文研究了如何在新的Web应用领域中使用设计模式和MVC架构,将MVC设计模式引入J2EE体系之中,根据Web应用系统的特点,就如何应用模式和MVC架构进行研究.提出基于MVC模式构建J2
“再生人”──生命科学的幽灵毕东海生命科学发展到今天,已经取得了举世瞩目的成就。对生命现象、生命本质以及生命的运动规律,可以说都有了比较详尽的认识,创立了许多学说。为
<正>目的探讨超声对阴茎海绵体硬结症的诊断价值。方法对47例临床手术证实阴茎海绵体硬结症的临床及超声特征进行回顾性分析。结果阴茎海绵体硬结症发生的部位与其数目,回声,
会议
据介绍,德国汉诺威自行车服务一价值担保机构的30名工作人员,在今年夏天,积极参与由德国ADFC(德国大众自行车俱乐部)及德国AOK机构共同组织、发起的“骑自行车上班”社会公益活动,
目的本课题采用2型糖尿病(T2DM)大鼠模型,通过观察大黄黄连泻心汤对T2DM大鼠的血糖、血脂、胰腺组织病理形态学改变及对骨骼肌中腺苷酸活化蛋白激酶α(AMPKα)、过氧化物酶体增殖活化受体γ共激活因子-1α(PGC-1α)、葡萄糖转运蛋白4(GLUT4)的m RNA及蛋白表达的影响,明确大黄黄连泻心汤对T2DM大鼠降糖、降脂作用,并探讨其作用机制,为中医药防治T2DM提供实验依据。方法选取40只
秋季是一个丰收的季节。水果市上,各式各样的水果,五颜六色,让你眼睛闪亮的同时,一定也让你的心犹豫不决。
近年来,简便易学的血糖仪日渐普及,在许多城市家庭,病友自己就可以在家里进行血糖检测。糖尿病病人要了解一天当中血糖的变化,已经不如以前那么困难了,所以尿糖的检测逐渐被忽视了
随着供给侧结构性改革的不断推进,人力资本在经济社会发展和竞争中的地位日益凸显,现行劳动法对劳动者辞职颇有“过度放任”之势,这集中体现于劳动者预告辞职制度的规定上。
上期说到了我在朋友小区里遇到的一个低血糖患者,发生低血糖时,表现出的“疯癫”状况。越来越多的人已经知道,糖尿病已经成为全球最大的健康杀手之一!可是没多少人了解糖尿病还