基于机器学习算法的信用卡客户违约分类模型研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:ospriteo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的快速发展、国内人均收入水平的不断提升以及大众消费习惯的转变,银行的信用卡业务不断发展,随之而带来的是信用卡风险,尤其是违约风险,因此研究信用卡的风险问题非常重要。分析表明信用卡数据集大多是类不平衡数据集,为此,建立基于类不平衡数据集和机器学习算法的信用卡客户违约分类模型,作为银行是否继续贷款,具有极其深远的意义。本文查阅了与本课题相关的近些年国内外的研究工作,对信用卡客户的分类方法,比如机器学习算法,进行了分析研究。本文选取台湾信用卡客户违约数据集作为本次的研究对象,该数据集来源是常用的加州大学欧文分校的UCI机器学习数据库。本文的主要研究工作如下:首先,建立了基于类不平衡的GBDT(Gradient Boosting Decision Tree)梯度提升树的信用卡客户违约分类模型,一是对本文的不平衡数据集进行平衡化,即过采样处理SMOTE(Synthetic Minority Oversampling TEchnique)人工少数类过采样法和ADASYN(Adaptive Synthetic Sampling Approach)自适应综合过采样算法及其相结合算法,得到一个新的数据集。二是总结了机器学习中随机森林和梯度提升树算法的原理和区别。三是介绍了构建类不平衡GBDT模型的具体步骤,预测该客户下个月是否违约,同时还对模型进行了参数调优和改进。经仿真对比评价指标,发现相对于RF(Random Forest)随机森林,该类不平衡GBDT模型的分类效果更好。然后,建立了基于GBDT+LR(Logistic Regression)逻辑回归的信用卡客户违约分类模型,一是对本文的不平衡数据集进行平衡化。二是利用GBDT算法,构造新的特征组合,即将GBDT中所有决策树每一个叶子节点作为一个新的特征。三是将新特征组合作为LR模型的输入向量。经仿真对比评价指标,该GBDT+LR模型的分类效果,比单纯使用LR模型,得到了较大的提升。最后,建立了基于加权Stacking的信用卡客户违约分类模型研究。一是建立集成学习,本文采用的是Stacking模型,采用的初级分类器是第三、四章提到的RF分类器、GBDT+Focal Loss模型和GBDT+LR模型。二是在此基础上,构建了初级分类器的加权Stacking模型,实验效果因此得到提升,效果比单独使用时好。这说明加权Stacking集成学习,对于本文使用的台湾信用卡客户数据集的分类效果有效。综上所述,本文主要工作是对台湾客户违约数据集进行不平衡处理,然后建模仿真,运用几种机器学习算法进行分类处理,最后构建了初级分类器的加权Stacking模型,达到了较高的Precision和Recall等指标。
其他文献
目前邮轮的建造逐渐趋于向舒适性、豪华型以及大型化方向发展,而随着邮轮的豪华程度和载客量的增加,意外引起火灾发生的几率也进一步增加。有效解决或降低火灾带来的安全事故,将有利于保障邮轮的安全运营和我国邮轮业的稳步发展。细水雾作为替代卤代烷的灭火介质,具有高效、安全和环保的优势而受到重视,并逐渐应用于船舶灭火。为了将细水雾灭火系统更好地应用于邮轮,以及了解细水雾灭火系统作用于邮轮上不同火灾情况的灭火效果
学位
近年来,轮缘推进器(Rim-Driven Thruster,简称RDT)作为一种新型电机推进器,其性能的优化设计始终是一个研究热点。由于RDT结构的特殊性,其性能研究通常只针对其中一个部件进行设计,如水力部件的水动力性能优化、电机的电磁场性能优化等,但轮缘推进电机与水力部件之间存在相互抑制的关系,只优化其中一个部件无法使整个推进器的性能达到最优,从而出现性能不协同的问题。为此,本文创新的提出一种轮
学位
热泳(thermophoresis)描述的是颗粒在温度梯度驱动下所产生的运动现象。带电胶体颗粒在水溶液中的热泳作为热泳领域最新的研究方向,在化工、能源、环境等领域广阔的应用前景和潜在的经济价值。例如,近年来带电胶体颗粒在水溶液中的热泳被发现为影响纳米流体传热的重要因素之一。而纳米流体的强化传热作为一个热门的研究领域,其可应用于提高太阳能热发电系统的能效、强化微型发动机甚至传统内燃机的冷却系统传热等
学位
潜艇的振动噪声问题一直受到广泛关注,研究潜艇振动噪声对国防军事建设具有重要意义。潜艇振动噪声领域的研究通常采用数值计算与声振试验相结合的方法,数值计算时通常基于潜艇结构特征将其简化为锥柱球组合壳进行分析,声振试验时通常根据原型设计合适的缩比模型进行进一步研究,然而在缩比模型中存在部分结构缩比比例无法与其它结构保持同比例的问题。当前模型声振完全相似已有大量研究,但对于缩比过程中部分结构发生畸变之后的
学位
船舶双层底结构作为现代水面船舶的典型结构形式之一,很多动力机械设备如主机、柴发机组、辅发机组等均安装在双层底结构上,动力机械设备所产生的振动通过内底及层间的实肋板、底桁结构传递至外底板,进而向水下辐射噪声。因此,双层底是振动传递的主要结构,对其进行振动传递路径分析并采取控制措施是有必要的。文中通过截取实际舰船的机舱双层底结构,将其按照1/2比例缩比,设计振动传递路径控制模型并搭建试验台架,以YDG
学位
在日益严重的能源危机和全球变暖的大环境下,发展新能源电动汽车成为现在汽车工业发展中的主要趋势。为了有效确保复杂工况下电动汽车运行的安全可靠,增加动力电池的循环寿命,增长电动汽车的续航里程,针对动力电池的电荷估计(SOC)和健康估计(SOH)的研究成为当前热点。由于动力电池是一个时变、动态、非线性的复杂系统,再加上其自身衰减、工作环境的复杂性,这些因素给电动汽车的电池管理系统(BMS)和电池内部状态
学位
大型邮轮国产化作为近年来中国船舶行业技术突破的难点,一直备受关注。打破欧洲对大型邮轮设计建造核心技术的垄断,实现大型邮轮设计建造本土化和配套设施国产化,对我国国民经济以及船舶行业的发展具有极其重要的意义。细水雾灭火系统作为大型邮轮的主要消防系统之一,对维护邮轮安全起着不可替代的作用。我国对细水雾灭火技术的研究和开发工作起步较晚,细水雾灭火技术在大型邮轮上的应用缺乏经验。因此,开展大型邮轮细水雾灭火
学位
随着全球航运量增大,废气排放量逐渐增加,为了响应节能环保,国际海事组织(IMO)出台更加严格的船舶能效法规。利用船舶余热回收技术可以实现对船舶废气余热的回收,并提高能源转换效率。S-CO2再压缩布雷顿循环发电系统因其较高的循环热效率,以及能源转换效率,并且其系统结构紧凑,整体尺寸较小,在多种能源中适用,因此在船舶余热回收发电领域中的应用具有持续可发展的潜力。目前S-CO2再压缩布雷顿循环余热发电系
学位
随着高能量密度永磁材料的兴起,大功率永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)在舰船、潜艇等重要领域的应用越来越普遍。然而,这些应用场景下的控制系统需要面临极端和复杂的工况,因此其对器件的可靠性、系统噪声、电流谐波含量、控制精度等性能有着较高的要求,控制系统的设计往往较为困难。针对这一现状,本文对大功率PMSM无位置传感器控制系统的设计进行了研究
学位
随着经济的发展,我国居民的生活水平不断提升,汽车作为主要代步工具其数量也在逐年递增,但燃油车的环保问题及化石能源枯竭问题让我们不得不考虑换一种环保的可再生能源作为下一代汽车能源,氢燃料电池由于其零排放、零污染、高能量密度和可再生等优势,被认为是汽车工业下一代核心能源的最佳选择,但目前燃料电池技术不够成熟、制造成本高及安全问题阻碍了其量产化和商业化。氢气作为一种易燃易爆气体,消费者对其安全性也是一直
学位