基于XGBoost-Stacking集成学习的贷款违约预测模型研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:villmid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确识别潜在违约贷款,提前阻止贷款发放或对已发放贷款进行跟踪处理以保证贷款收益,是金融风控领域的核心问题。针对当前贷款违约预测模型分类性能低、缺乏稳定性且泛化能力不足等问题,本文利用金融贷款数据集构建了基于GSCV-XGBoost的贷款违约预测模型,提出了基于XGBoost-Stacking集成学习的贷款违约预测模型,基于Django框架开发了贷款违约预测系统。主要研究工作和成果包括:1.构建了基于GSCV-XGBoost的贷款违约预测模型。首先,对金融贷款数据集进行预处理,结合描述性统计分析衡量特征变量与目标变量之间的相关性,选取特征子集用于构建基于XGBoost的贷款违约预测模型。其次,利用网格搜索、五折交叉验证方法对模型进行参数寻优与模型训练,形成基于GSCV-XGBoost的贷款违约预测模型。实验结果表明,相较于参数优化后的支持向量机、K近邻、逻辑回归、随机森林四种模型,GSCV-XGBoost模型在分类性能上表现更佳。2.提出了基于XGBoost-Stacking集成学习的贷款违约预测模型。采用Stacking集成学习算法多模型融合思想,将逻辑回归、随机森林、K近邻模型作为Stacking算法的第一层基学习器,使用基于XGBoost的贷款违约预测模型作为第二层基学习器,通过模型分层融合克服单一模型的缺陷,提高贷款违约预测的分类性能、稳定性及泛化能力。并将该模型与四种单一模型进行对比,实验表明,相较于单一模型,该模型具有更优的分类性能、稳定性及泛化能力。3.基于1.2中构建的贷款违约预测模型,采用Django框架开发了一个贷款违约预测系统,实现了对贷款违约的有效预测与分析。主要贡献:基于金融贷款数据集,结合网格搜索、五折交叉验证方法,构建了基于GSCV-XGBoost的贷款违约预测模型;采用Stacking算法进行了多模型分层融合,提出了性能更佳的基于XGBoost-Stacking集成学习的贷款违约预测模型;开发了一个贷款违约预测系统,实现了对贷款违约的有效预测与分析。
其他文献
学位
学位
近年房地产市场的蓬勃发展,带动全国各地的不动产价格一路走高,为了借贷方便,越来越多的人选择以不动产作为抵押物,为借贷合同顺利履行提供担保。但是在实际的市场交易与司法实务当中,往往因为当事人双方另有约定、债权人和抵押人个人拖延登记、房管登记机关错漏等原因,使得债权人与抵押人在订立不动产抵押合同后未能完成办理登记手续,由此导致了同案不同判的现象频发。有鉴于此,本文首先介绍了不动产抵押合同的概念以及效力
近年来消费升级,产品种类日益丰富,由此引发的激烈的市场竞争受到前所未有的重视,成为企业创造价值的核心驱动力。随着国家扶贫政策的实施,地域特色产品受到重视,本课题以湘西地域文化的视角,以背篓人家餐饮品牌为研究对象,结合湘西的地理环境、建筑特征、经济要素、风俗民情、民族文化等方面,分析背篓人家餐饮品牌的特色和所处地的地域文化。通过文献研究法、案列分析等方法分析背篓人家餐饮品牌的现状以及需要改进升级的空
宫颈癌是严重威胁女性健康的恶性肿瘤,早期宫颈癌细胞筛查有助于患者及时预防和治疗,利用计算机技术对宫颈癌细胞图像进行识别辅助医生完成诊断成为目前研究的热点之一。但是宫颈癌细胞的识别技术面临着许多问题严重影响识别的准确率,比如细胞重叠,背景含有与宫颈癌细胞无关的细胞或杂质。为了解决上述问题,本文基于深度学习对宫颈癌细胞识别进行研究,主要的研究内容如下:(1)提出一种基于改进的圆周卷积的宫颈癌细胞分割算
目的:系统评价替罗非班防治急性ST段抬高型心肌梗死患者在经皮冠状动脉介入治疗中缓慢/无复流现象的临床有效性与安全性。方法:计算机检索Cochrane对照试验资料库、Pub Med、Embase、Web of science、中国生物医学文献数据库(CBM)、中国知网数据库,以上所有数据库的搜索时间均由建库开始至2021年4月。由2名评价者独立评价纳入研究的质量、提取资料并交叉核对,对同质研究采用R
儿童自然缺失问题带来了公众对自然体验教育的关注,休闲农业是一种很好的兼顾儿童自然体验与农业经济发展的模式,具有很强的生命力。但儿童体验式休闲农业在我国还处于起步阶段,不重视品牌形象设计的系统性和科学性,在一定程度上阻碍了休闲农业的发展。因此,本课题从用户体验的视角出发,对儿童休闲农场品牌的设计进行分析和探讨。本课题从用户体验的视角对休闲农业和儿童群体进行分析,探索儿童体验休闲农场品牌构建的方向。在
没骨法和破墨法作为一种传统技法,更多的运用在在花鸟画中,随着绘画的多样性和创作性手段日益丰富,技法的边界性也变得模糊起来;时代的发展和文化美学的交流融合更是让中国水墨画不断的展现出新的形势与面貌。本文将没骨和破墨作为一种技法和传统笔墨精神的象征,从没骨和破墨的发展和演变、技法的借鉴和解读,到技法的延伸和丰富以及在创作中的运用这几个方面;将传统笔墨的传承和时代历程变化作为创作前提,用没骨人物画的表现
随着城镇化建设快速推进,越来越多的城市高层建筑采用玻璃幕墙来作为装饰,但玻璃幕墙后期的清洁检测维护却是一大难题。目前市场上,仍旧是采用传统人工方式,危险系数大,且清洗设备成本高昂。如果没有专业、便捷的检测设备,将大大制约玻璃幕墙的实用化进程。基于对解决社会问题和产生具有社会价值产品的思考,探索并建立了“D+X”模块化设计方法。致力探讨技术与创新的关系,将模块化的理论探讨引入产业实践,通过数字化平台
近些年来,互联网的发展已经渗透到了每一个领域,伴随着计算机技术与网络的迅猛发展,网络安全问题也面临着严峻的考验,各种形式的网络入侵行为层出不穷。如何快速高效的检测网络异常入侵行为已成为网络安全领域的一个重要议题。当前已有的网络入侵检测相关技术研究,其存在研究数据样本不平衡,低占比样本预测召回率低,技术操作复杂难以推广等问题。基于此,本文将采用基于Easy Ensemble下采样与Table Gan