基于混合采样和代价敏感的样本不均衡处理

来源 :郑州大学 | 被引量 : 0次 | 上传用户:daocaoren666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信贷业务是商业银行等金融机构的核心业务之一,而智能风控模型是信贷业务的主要技术手段,也是大数据算法的主要应用场景之一。但是,在风控模型建立过程中样本不平衡现象是普遍存在的亟待解决问题之一。本文建立了基于混合采样策略与代价敏感方法相结合的样本不均衡处理模型,在模型中首先基于混合采样策略调整正负样本比例,然后依据代价敏感方法训练模型。本文采用Kaggle竞赛数据集“Give Me Some Credit”进行实证分析,经过特征工程最终选定10个变量进入建模环节。在建模过程中,首先分别基于上采样策略、下采样策略、混合采样策略对非平衡的信贷数据集进行处理。接下来,将平衡后的数据集分别与Linear SVC算法、Logistic回归算法、决策树算法、基于代价敏感的Adacost算法相结合构造逾期预测模型。最后使用模型评价指标:Recall值、AUC值、F1值、G-mean值进行比较分析。结果表明,基于SMOTEENN和Adacost构建的逾期预测模型相较于其他分类模型,增强了对违约客户的识别能力。即Recall值有显著提升,达到了0.92,AUC值、F1值、G-mean值均高于0.90。
其他文献
钛合金熔炼工艺中,真空感应熔炼生产的钛合金质量好且成本低,是理想的钛合金熔炼方法,但由于钛合金化学性质活泼,在高温下会与常用耐火材料发生反应,导致在使用真空感应熔炼工艺熔炼钛合金时,出现钛合金侵蚀坩埚并影响钛合金质量的现象。因此,研发一种具有优异高温稳定性以及抗侵蚀性能的新型坩埚材料是钛合金熔炼技术中亟需解决的关键问题。(Ca,Sr,Ba)ZrO3高熵陶瓷具有良好的高温稳定性,并表现出对Ti Ni
学位
氮化铝(Al N)是一种综合性能优异的新型陶瓷材料,其具有高热导率(320W/m K)、良好的耐腐蚀性、高电阻率、高硬度和耐磨性,在电子电力、机车、航空航天、国防、军工、通讯以及众多工业领域都具有广阔的应用前景和广泛的潜在市场。在铝基体表面形成的Al N层不仅能有效地提高其耐磨性能,而且能够拓展铝在半导体等电子行业的应用。传统制备氮化铝层的方法有直流反应磁控溅射法、化学气相沉积、等离子喷涂法、等离
学位
斜拉桥跨度大、索塔高度高,地震、强风等灾害对斜拉桥的安全性影响较大,斜拉桥抵抗多灾害能力已成为研究的热点之一。本文以某大跨斜拉桥为例,通过静动力等效建立索塔有限元模型;采用易损性方法,进行索塔地震易损性及风灾易损性分析;考虑地震、风作用方式及风速对易损性的影响,研究了地震-风共同作用下斜拉桥索塔多灾易损性。本文的主要研究内容如下:(1)以斜拉桥全桥模型静、动力特性为参考,考虑斜拉索及主梁的影响,采
学位
材料经渗碳热处理后会在其表面形成一定厚度的变质层,变质层的引入会改变材料的微结构和力学性能。在循环载荷作用下材料常常会表现出包辛格效应、循环软硬化、累积损伤等与单调载荷不同的力学响应特征,因此对材料表面变质层的力学性能,特别是循环特性进行研究对改善工件表面质量和提高关键构件的疲劳寿命具有重要意义。本文通过开展静态力学试验、循环加载试验和仿真模拟,分析了应变速率对不同表面变质层厚度的18CrNiMo
学位
配电线路是电力系统的重要组成部分,其运行状态对整个电力系统的安全可靠性具有显著影响。作为一种暴露在室外的杆塔式结构,配电线路中钢筋混凝土电杆电线体系结构对风荷载和地震等自然灾害反应非常敏感。历次地震灾害中,杆塔发生倾斜、出现构件局部损伤或倒塌整体破坏的情形时有发生,严重威胁我国电网的运行安全并对经济造成损失。目前我国规范对110kV以下的配电线路杆塔是否进行抗震验算并未明确规定,且国内外学者对配电
学位
随着我国经济增速放缓、人口红利逐渐消失,建筑行业面临着劳动力减少、人工成本快速上升的困境。同时,传统的现浇施工产生大量的建筑垃圾,对环境造成了严重的影响。因此,装配式建筑迎来发展契机,并持续推动建筑行业实现绿色可持续发展。而预制装配式混凝土楼板与预制墙体的连接构造是实现装配式建筑装配高效和性能安全可靠的重要保证。合适的连接方式使荷载在预制元件之间得以有效传递,并能提高节点的承载能力及延展性,对于预
学位
为了解决特大跨径拱桥系杆张拉合理方案难以确定的问题,提出了一种基于影响矩阵法的系杆张拉优化方法。该方法基于施工阶段系杆张力对结构内力、应力、反力等的影响矩阵,建立了施工阶段系杆张力与结构总响应的计算关系,给出了系杆张力在各类型响应约束条件下的可行域计算方法,以此求解出系杆张力在任意施工阶段约束条件下的可行域,解决了复杂施工阶段的系杆拱桥分阶段成形最优张拉计算问题。在跨径为507 m的目前世界最大跨
期刊
近年来,随着社会经济的增长以及人类生存范围的扩张,人类的活动对自然环境造成的影响越来越大,气象变化更加反复无常,导致降水量的波动性逐渐增强,由降水量过多或过少引起的灾害日益增加。降水量的多少直接影响到农业生产、水利水电、社会生产生活等,因此,准确地预测降水量对人类的生活和发展有重大意义和实际应用价值。论文主要利用郑州市1990年1月至2022年3月的月降水量数据进行研究,把1990年1月至2019
学位
斜拉索是大跨度斜拉桥的关键受力构件之一,其受力状态及几何参数的准确确定是开展结构设计分析和施工控制的重要基础和前提之一。针对这一问题,基于悬索解析理论以及数值求解技术,研究了斜拉索在给定目标索力条件下受力状态及几何参数等信息的快速高精度计算方法。首先,根据悬索解析分析,对适于工程应用的斜拉索线形、倾角及无应力索长等计算控制方程进行了分析总结,重点针对控制方程参数,在分析简单迭代格式的基础上,结合弦
期刊
滇西马厂箐铜钼多金属矿床位于三江特提斯成矿域,是一个与喜马拉雅期富碱斑岩侵入有关的多金属矿床。前人研究表明,马厂箐铜钼多金属矿床形成于斑岩-矽卡岩成矿系统,但由于缺乏系统矿物学研究,目前对矽卡岩矿化过程和成矿效应仍不清楚,限制了对该矿床成矿过程的全面认识。因此,本文以马厂箐矿床矽卡岩型矿化中的石榴子石为研究对象,利用H-O同位素、电子探针(EPMA)以及LA-ICP-MS原位微区技术开展了同位素及
期刊