面向不平衡数据的集成信用评分模型研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:lxting86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网金融的迅猛发展,信用风险管理面临的挑战也愈发严峻。信用评分模型作为信用风险管理的核心内容,旨在发现潜在的违约贷款人,规避金融风险,在金融行业中发挥着重要作用。然而,信贷客户数据的高度不平衡特点也影响着信用评分模型的性能。如何有效地处理不平衡数据,提高信用评分模型性能是近年来研究的热点问题。针对信贷客户数据的高度不平衡特点,本文首先对原始数据进行了均衡化的处理,然后在此基础上建立了集成信用评分模型,主要研究内容与创新点如下:(1)针对信用不平衡数据的问题,本文提出了基于生成对抗网络的不平衡数据扩充方法。该方法首先利用生成对抗网络对原始少数类样本进行学习,并生成符合原始数据分布的样本;然后基于欧氏距离对生成的样本进行筛选,使得生成样本较多地分布在样本边界,丰富了边界样本信息;最后合并原始数据与生成的少数类样本以获得均衡的样本集。实验结果表明,对于不同的不平衡比例的数据集,该方法都能有效地扩充数据,并且在十个基分类器上均能取得较好的效果。(2)在均衡化后的数据基础上,本文提出了一个基于深度神经网络(Deep Neural Networks,DNN)的极端梯度增强(Extreme Gradient Boosting,XGBoost)集成信用评分模型。在所提出的模型中,首先采用装袋采样方法将训练集划分为可变训练子集;其次对每个训练子集利用DNN网络构建特征提取器;然后将特征提取器中的隐藏层数据作为XGBoost的输入来构造基分类器;最后利用概率平均对不同基分类器的输出进行组合生成最终样本预测标签。为验证本文模型的性能,实验数据采用了UCI库中的三个公开信用数据集,同时评估了DNN的隐藏层数对于模型性能的影响,结果表明,与对比的基础分类器、集成分类器和变体模型相比,本文模型的准确性都有显著提高。
其他文献
近40年来中国经济高速增长,已晋升为全球第二大经济体,但随之而来的资源消耗和环境污染等问题日趋严重,经济的发展和环境的保护受到粗放型发展方式的阻碍,以创新驱动代替要素
小企业在我国国民经济中发挥重要作用,是发展国力和社会发展的重要基础。与大中型企业相比,小企业在管理模式和财务制度上存在许多问题。目前,小企业信贷业务已成为我国商业
《金楼子》是萧绎花费三十余年编撰而成的一部子书,历来研究者对该书的评价褒贬不一。萧绎本人博览群书,勤于著述,《金楼子》一书集中承载着他的创作理想。本文对《金楼子》
近年来,各级政府对专项资金的投入日益增多,但由于仅追求规模,资金管理相关制度建设有所欠缺,管理水平没有得到同步提升,导致了近年来涉及专项资金的腐败案件高发多发,应当引
排他性促销是指公司向选定的顾客(即,交易的接受者)提供特定的促销优惠,而非提供给其他顾客(即,交易的非接受者),包含较高的交易排他性。尽管排他性促销在生活中越来越常见,
随着可穿戴电子设备的飞速发展,柔性能源存储器件的需求也不断增加。其中,具有功率密度高、使用寿命长和快速充放电等优点的柔性超级电容器成为科研人员的研究热点,但针对可压缩弹性器件的工作报道却很少。超级电容器的电极是决定其电化学性能的重要因素,同时作为弹性超级电容器的电极,力学性能也是一项重要指标。廉价易得的厨房海绵有很好的机械弹性和天然的三维骨架,将其作为基底材料与其他活性物质复合可用于制备柔性超级电
学位
TiAl基合金因其密度低、高温强度优异高、抗蠕变和抗氧化性能突出等优点,在航空航天、海洋船舶等国防工业及汽车民用工业受到瞩目,引起科研工作者的广泛关注,是最具潜力的轻质高温材料之一。但这类材料具有本征脆性、高温变形抗力大,导致难以加工成形,严重制约了它的进一步发展与应用。本文采用高能球磨+热压烧结制备具有双峰结构的TiAl合金,研究其高温力学性能。在此基础上,对具有双峰结构的TiAl合金进行热变形
学位
盐业在我国社会经济中具有非常重要的地位,但由于我国盐业经营体制改革正处于摇摆阶段,使得当前制盐行业的发展并不稳定。针对频频爆出的食品安全问题,通过实施质量成本管理
随我国金融业的不断发展,商业银行在其中占据着重要的位置,以往我国的商业银行一直处于提投入高回报的状况,但是由于当前外资银行进入我国市场,使我国商业银行的经营业绩找比
贫困问题一直是世界性难题,中国作为世界上最大的发展中国家,农村贫困人口基数大,截止到2018年底我国仍有1660万贫困人口,如何有效稳定解决农村贫困人口脱贫,是全面建成小康