基于XGBoost的网络贷款风险预测

来源 :湘潭大学 | 被引量 : 3次 | 上传用户:sylviawan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着银行和金融机构的贷款业务越来越多,坏账对互联网金融市场的发展带来极大的负面影响。如何制定一个策略对客户是否会违约做预测,并使利润达到最大化,是所有信贷机构最关心的问题。因此,就如何减少不良贷款问题建立一个准确的信用评分卡模型对市场经济的稳定发展有重要意义。在背景介绍和数据准备部分,首先,介绍了信贷风险的概念和P2P信贷的发展背景,并对几种机器学习模型理论和信用评分卡理论做了阐述。其次,针对某互联网金融平台的个人信贷数据集,通过数据探索、数据预处理、特征工程等操作,生成了可用于建模的数据。在模型实证分析部分,首先,建立了基线模型和XGBoost模型,采用评价指标AUC值和KS值研究了模型对逾期客户的判别能力,发现XGBoost模型优于逻辑回归、决策树和随机森林三种基线模型。其次,针对数据的不平衡性质,通过引入代价敏感学习策略,提出了改进版XGBoost模型。相比原XGBoost模型,改进后的XGBoost模型对逾期风险的预测精度得到了一定的提升。最后,针对XGBoost模型,采用Stacking融合技巧,提出了新的XGBoost模型。相比原XGBoost模型,新模型的AUC值和KS值都有一定的提升,对逾期风险的预测更加准确。
其他文献
软件故障预测运用软件度量指标及历史故障数据建立预测模型,以确定待测软件模块是否有故障倾向性。故障预测研究中,特征选择是一个重要步骤,该步骤选取一定维度的部分故障数据建立预测模型来提高模型性能,以达到压缩特征维度,提高模型预测精度,降低预测模型复杂度,节约计算资源的目的。软件故障预测中若采用大量度量指标建立预测模型可能因其中含有无关特征使预测模型性能受到不良影响,因此故障预测中的特征选择具有重要的研
医疗卫生服务始终是世界各国广泛关注和优先发展的领域之一。完善的医疗卫生服务有利于保障人民健康、促进经济发展、构建和谐社会。江苏省宿迁市针对医疗资源严重不足、基层医疗卫生单位生存困难、各级财政无力投入、人民群众方便就医愿望迫切这一特殊市情,引入社会资本办医,在全市范围内将所有的医院进行产权置换,全面推行民营化。一度以“卖光式医改”闻名全国的宿迁,直到2013年才开始建立第一家由政府出资办的公立医院。
血清应答因子(serum response factor,SRF)与其顺式元件CArG-box之间的相互作用对于平滑肌标志基因的转录是非常重要的.但为什么SRF这样一个普遍表达的转录因子能够选择性的激
本文以大连科技学院中职升本教学为例,通过对在校三个年级中职升本学生学习现状和存在问题进行分析,提出提高中职升本学生教育教学质量的对策。
摘 要:大学生思想政治教育工作的开展,必须在新理念、新形势下积极实施法制教育,特别是社会主义、集体主义、爱国主义等的融入,有助于引导大学生正确处理人际关系。  关键词:政治教学;大学生;思想政治  新时期我国高校对大学生的思想政治教育就是有目的、有计划、有针对性地对大学生进行法律意识和法治观念的教育,是加强对大学生思想政治教育中社会主义民主法治的教育,以期提升大学生的法制意识。法制环境下的高校思想
随着我国资本市场的逐渐完善,资产剥离作为资产重组的一种方式,正被越来越多的企业运用。但是在当前理论界,关于资产剥离的动机和绩效研究的文献并不丰富,关于资产剥离如何影响企业绩效也并未达成一致的意见。本文以四川双马水泥股份有限公司的资产剥离事件为案例,对资产剥离进行研究。首先,本文介绍了当前水泥行业的背景,阐述了水泥行业进行资产剥离的必要性,并且对当前的理论研究现状作了系统的介绍。其次,本文从股权结构
在现代化信息技术不断发展的推动下,BIM技术已经在多个行业领域中实现了应用推广。其中,BIM技术在建筑给排水施工中的应用发挥了重要的应用价值。本文简要就BIM技术在高层建
目的基于明清时期医家治疗癫病的处方,对相关用药规律进行探索并开发新方,希望能将研究成果运用于实验、教学和临床,为关于癫病的科学研究及新药的研发提供借鉴。方法立足于《中华医典》,收集明清时期诸医家治疗癫病的处方,提取方剂中药物组成,进行性、味、归经、功效等的频数、药物关联规则分析及复杂熵聚类分析。结合明清时期诸医家的学术思想,探寻癫病的用药规律。结果本课题共收集关于癫病处方118个,中药179味,共
随着移动互联网的普及,电信用户市场渐趋饱和,电信行业用户增长持续放缓。各运营商在不断发掘新增用户的同时,相互之间的市场竞争也在加剧。近年来实施的“携号转网”政策更是加速了用户在电信企业之间的流动,如何及时发现有离网倾向的用户并对其推出个性化的营销策略进行挽留,成了电信行业亟需解决的目标。用户流失领域普遍存在类别不平衡的问题,流失用户所占比例较小。传统的二分类算法默认分类的错误代价是相同的,然而将一
随着建筑功能的不断丰富,工程设计越来越复杂。目前地基与基础设计过程中存在的问题是柱下独立基础带梁板式的地下室底板设计中,容易忽视因建筑物沉降所引起的附加应力的影响。