基于优化融合Stacking算法的贷款决策模型研究

来源 :山西师范大学 | 被引量 : 0次 | 上传用户:layueee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,“互联网+金融”模式的兴起,使传统银行走上了转型发展的新道路。银行信贷业务的互联网化给贷款客户提供了便捷和高效的新体验,但伴随而来的信贷风险是一大难题。因此探究更高效、更好性能的贷款决策模型对于网络贷款业务的发展具有重要意义。Stacking算法是一种模型融合算法,选择异构且性能好的基分类器对Stacking算法具有积极的影响。研究发现,其第一层训练集经过五折交叉训练后,将预测结果直接作为第二层元分类器的训练集,忽略了第一层基分类器的分类效果对元数据集的影响,从而限制了Stacking的融合能力,且Stacking算法对过程处理的依赖性较强,因此,如何使元数据集的组合策略更加有效,如何降低Stacking在数据处理、特征选择、参数设定、基分类器训练等环节的干扰成为本文研究的重点。本文基于优化融合的Stacking算法构造贷款决策模型,具体工作如下:首先,以新兴的XGBoost、LightGBM算法,以及并行集成方法中的随机森林算法作为基分类器,构建出基本的Stacking算法。基于以上问题,本文结合Adaboost中对分类错误样本调整权重的思想,提出自适应权重融合的Stacking算法。即对基学习器训练及预测结束后得到的结果,再次组合训练时先初始化其权重,然后在训练过程中计算误差并不断调整权重,从而使得效果好的基分类器对最终结果有正面的带动。其次,运用优化的XGBoost算法作为训练Stacking贷款决策模型的样本选择方法。XGBoost算法在创建提升树后,能够直接获取属性的重要程度分值,由节点负责加权和记录次数,最终得到重要性评分和排序。本文依据XGBoost算法获得的重要性评分,在scikit-learn中通过SelectFromModel类进行特征选择。这项特征选择方法相较于人工经验选择更加科学化、合理化,有效降低了模型的特征扰动。最后,本文以贷款数据为实验样本,基于模糊的B-XGBoost算法和自适应权重的组合方式,给出了以XGBoost、LightGBM和随机森林为基学习器的优化融合的Stacking贷款决策模型。分析实验结果,发现其AUC值从原来的0.67提升到0.71,自适应权重组合策略优化后的Stacking算法总体性能较优。
其他文献
在工地现场的安全管理中,对施工人员的安全帽佩戴监管是非常重要的。近年来,部分学者对安全帽的检测识别做了一些研究,但主要都是采用传统目标检测方法,这类方法检测准确率低,速度慢。随着深度学习技术的发展,该技术被广泛使用于目标检测任务中,并且取得了很好的效果。因此,本文基于深度学习技术针对安全帽佩戴检测开展研究,实现对施工现场作业人员安全帽佩戴的快速准确检测,为工地安全监督和执法提供技术保障,对施工现场
当前,我国煤炭行业产能过剩问题日益严重,供给侧改革的推出是必然趋势。通过借鉴美、德、日三个发达国家去产能的先进经验,提出我国煤炭企业践行供给侧改革的对策建议,包括大
财政部新颁布的<企业会计制度>(以下简称"新制度")打破了分行业会计制度的做法,对会计要素进行了重新定义,对资产、负债、收入、费用等规定了统一确认的计量标准,对于不符合
随着计算机技术和信息科学技术的迅速发展,人们的工作和生活方式发生了翻天覆地的变化,软件已广泛应用于社会生活的各个领域,使它成为了当今社会发展中非常重要的角色。从2001敏捷宣言公布到今天,经过十多年的发展,敏捷开发模式已经成为软件项目开发管理的主流模式,越来越多的企业开始关注敏捷并实施敏捷,但随着敏捷开发模式的实施,人们也开始逐步意识到对实施结果的评估也是非常重要的事情,如效果如何?遇到的问题如何