基于深度异构Stacking模型的信贷违约检测

来源 :郑州大学 | 被引量 : 0次 | 上传用户:deiaw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能和金融科技的发展,对金融产品和业务模式产生了颠覆性的影响,为人们带来便利的同时也产生了大量的信用风险问题。因此,如何高效准确的评估和预测信贷违约风险成了银行等金融机构亟需解决的问题。而通过对借款人基本属性、借贷相关等海量信息进行归集,并利用机器学习算法建立风控模型,是当前金融风控领域研究的一个主流方向之一。本文基于串行融合策略和Stacking模型融合思想,提出了深度异构Stacking模型融合方法,该方法利用多个可以自动进行特征组合的集成模型,作为特征生成器来构造新特征,并将新特征与原始训练集合并,继续训练下一级多个集成模型,通过不断地更新训练集实现多层融合,最后使用逻辑回归作为预测模型输出结果。本文利用Datawhale与天池联合发起的金融风控比赛数据集,通过数据清洗、缺失值填充、分箱编码、特征选择等确定17个入模特征。然后使用随机森林、Light GBM、XGBoost作为每一级的基学习器,构建了3个深度异构Stacking信贷违约检测模型,相较于基学习器和其他模型融合方法,效果得到了明显提升。特别地,2层深度异构Stacking模型的性能最好,对比基学习器中性能最好的Light GBM,评估指标KS、AUC、F1分别提升3%、1.4%、1.6%。此外,本文使用Kaggle上“Give Me Some Credit”信用比赛数据集进一步验证了该方法的有效性。本文提出的深度异构Stacking模型融合方法可以综合多类算法的优点,在稳健性和样本区分能力上都表现较好,在预测信贷违约风险的问题上有较高的普适性和应用价值。
其他文献
在当前党中央大力提倡各级党员干部担当作为的背景下,在建党100周年全面建成小康社会、开启全面建设社会主义现代化新征程之际,在全面脱贫攻坚取得决定性胜利,全面推进乡村振兴的背景下,乡镇公职人员作为保障基层运转,为基层群众直接服务的重要群体,身处最前端、干在最前沿,处理的工作复杂且具体,必须能够打好主动仗,敢于担当作为。随着基层工作任务越来越多,服务功能越来越完善,乡镇公职人员处于一种“进退两难”的状
学位
作为一种行政管理体制,属地管理是指在特定的行政区域内明确管理主体和责任,并赋予属地管理主体一定的自主权,以充分调动各方工作的积极性,提升治理效能,实现守土有责。然而,在实际工作中却呈现出了“好经念歪”的不良现象,旨在强调守土有责、守土尽责的“属地管理”成了上级政府和职能部门甩锅避责的工具,借助“属地管理”之名将原本属于自己承担的任务和责任层层转包给下级,处于行政管理末梢的乡镇政府便陷入了“有限权利
学位
在中国现行的市场经济的大环境中,小微企业是非常重要的组成部分,对促进市场经济的稳定发展起到了很大的作用,能够活跃经济、增加就业、转变产业结构。小微企业最明显的特点是规模小,创建资金少,相对于大企业限制条件少,涉及行业多,适合较小的经营主体,能活跃市场,同时解决就业问题。但是,由于小微企业资金不充裕、易受到经济大环境的影响,资金流动程度差等原因,企业的生存周期往往较短。国家财政部、税务总局在2019
学位
芝麻(Sesamum indicum L.)是我国主要油料作物之一,在其生长过程中易受多种病原菌侵染,其中芝麻叶斑病是主要病害之一。近年来由山扁豆生棒孢(Corynespora cassiicola)引起的芝麻叶斑病在我国芝麻产区普遍发生,在局部地区造成了严重的经济损失。目前,利用导致寄主致病力衰退的真菌病毒控制真菌病害已经成为潜在的生物防治途径之一,但有关山扁豆生棒孢菌株携带内生病毒的研究国内外
学位
种间杂交及多倍化是植物育种和物种多样性的主要推动力。花粉发育是植物发育的关键步骤,也是成功育种的重要环节。植物有性繁殖的先决条件是形成可育花粉粒,然而调控花粉育性的潜在机制尚不清楚。因此,研究异源二倍体和异源四倍体花粉发育的遗传变化,有助于我们进一步认识异源多倍化在植物雄配子体发育过程中对花粉育性的调控作用。芸薹属作物与模式植物拟南芥的亲缘关系最近,是研究植物多倍化的模式系统。本研究对人工合成异源
学位
随着国内经济高速发展和人民生活水平不断提高,餐饮行业迎来了飞速发展。同时近年来各地餐饮行业频繁发生的食品安全事件也暴露出该行业广泛存在较高的食品安全风险,一些国内外知名餐饮品牌连续出现了食品安全违法行为,尤其是河南省新乡市某地校园供餐单位引发的学生集体中毒安全事故,成为了百姓关注的热点,引发全社会对食品安全问题的担忧。我国目前已进入新时代高质量发展阶段,需要不断完善共建共治共享的社会治理制度,基层
学位
表皮毛是由植物的表皮细胞形成的一种特化的单细胞或多细胞结构,是植物地上表皮细胞的延伸。表皮毛的形态结构具有多样性,因此造就了其功能的多样性。表皮毛不仅在植物响应生物胁迫和非生物胁迫中发挥重要作用,具有多种保护功能,而且有的表皮毛还具有重要的经济价值。例如,棉花作为一种世界上重要的经济作物,其经济价值主要体现在棉纤维上。因此,揭示表皮毛起始和发育途径中的关键调控因子和调控机制,具有重要的理论意义和应
学位
CRISPR/Cas9编辑技术由于其简便性和高效性,迅速成为了动植物领域基因功能研究的新方法。在植物基因编辑应用中,常见的CRISPR组分投送方式为农杆菌介导的Ti质粒叶注射法、基因枪轰击法和原生质体转染法等。这些方法虽然可以准确的将基因编辑组分Cas9以及sgRNA投送到靶细胞的细胞核中,但是想要得到稳定遗传的突变体后代,需要通过耗时耗力的组培再生。而使用植物RNA病毒载体投送CRISPR编辑组
学位
大肠杆菌Rec A的同源物Radiation sensitive 51(RAD51)蛋白,最早在酿酒酵母中发现,是同源重组的中心重组酶,在减数分裂与有丝分裂中均起作用。RAD51具有依赖于DNA的ATP酶活性,可催化DNA链交换,对于DNA损伤修复、同源重组和基因组稳定性的维持非常重要。当前,全球气候变暖对植物的生殖发育影响极大,已成为作物减产的主要原因之一,提高植物高温胁迫下DNA损伤修复的能力
学位
近年来,新媒体技术的迅猛发展加速了网络上谣言的大规模传播分享,对于社会及个人都造成了严重的负面影响。采取有效的控制措施是改善社交网络生态系统质量,为人们营造一个安全可信的网络环境的重要手段。在社交网络谣言控制领域,寻找具有最大传播影响力的重要节点对于有效控制谣言传播具有重大现实意义。论文通过引入基于D-S证据理论的信息融合技术,系统地研究了多特征融合的节点重要性度量问题,以及重要节点在社交网络谣言
学位