【摘 要】
:
客户信贷违约风险预测是金融借贷机构进行信贷风险控制的一种重要手段,有助于金融机构规避信用不良或存在欺诈风险的客户。但是,随着信贷业务规模的不断扩张,传统人力审核信贷的方式暴露出诸多缺点:如人力审核的速度慢、容易出现偏差等。通过构建机器学习信贷违约预测模型,可以快速审核申请贷款的用户,极大地节省了人力资源,成为行业内解决信贷违约预测的一种重要手段。但目前有关信贷违约风险预测模型的研究依然存在三点不足
论文部分内容阅读
客户信贷违约风险预测是金融借贷机构进行信贷风险控制的一种重要手段,有助于金融机构规避信用不良或存在欺诈风险的客户。但是,随着信贷业务规模的不断扩张,传统人力审核信贷的方式暴露出诸多缺点:如人力审核的速度慢、容易出现偏差等。通过构建机器学习信贷违约预测模型,可以快速审核申请贷款的用户,极大地节省了人力资源,成为行业内解决信贷违约预测的一种重要手段。但目前有关信贷违约风险预测模型的研究依然存在三点不足:(1)机器学习模型在学习训练前,需要制备平衡的数据集。平衡数据集的方法多采用合成少数类过采样技术,并没有学习到数据集本身的统计特征;(2)包括逻辑回归在内的机器学习线性模型虽然对数据特征有较好的解释性,却也容易让不法分子伪装出与优质客户一样的信贷特征,从而欺骗机器学习模型;(3)由于特征工程等导致的信息损失,以及线性模型不易捕捉数据集本身具有的非线性的特征,导致模型的准确率还可以进一步进行提升。为了解决以上不足,构建高准确率且安全的预测模型,本文通过深度学习技术建立信贷违约预测模型,使模型更加安全可控,且提升了模型预测的准确率,此外,以深度学习信贷违约预测模型为核心,开发了信贷违约预测系统。本文主要工作体现在以下三点:(1)采用对抗性生成网络(GAN)解决数据平衡问题。本文基于P2P平台Lending-Club提供的真实信贷数据集进行研究,首先,对该数据集进行了数据分析,经过数据清洗、特征编码,得到正负类样本比例为9:1的不平衡数据集;然后,通过对抗性生成网络(GAN)模拟生成少数类样本数据,解决数据不平衡的问题,对比合成少数类过采样技术(SMOTE)等传统平衡数据集的方法,采用GAN的模型准确率得到提升。(2)构建了结合残差神经网络(Res Net)和对抗性生成网络(GAN)的深度学习模型,提高模型的准确率。同时,构建了多种对比模型,包括:逻辑回归、随机森林、梯度提升树、人工神经网络。构建的深度学习预测模型,利用Res Net在经过GAN处理得到的平衡数据集上进行训练,对数据集本身的非线性特征进行挖掘,相较于对比模型的准确率平均提升约5%。(3)以深度学习预测模型为核心,设计和实现了信贷用户信用评分原型系统。该系统能够通过用户填写的信息计算出该用户的信用分数,分析用户的信贷特征对该用户信用分的影响程度,实现了一种深度学习模型与信贷违约预测相结合的实际行业应用方案。
其他文献
非物质文化遗产(以下为“非遗”)是人们精神世界的源泉,它对多种多样且活动变化的民族文化,人类无穷的制造与构想力有所体现。非遗保护机制作为推动非遗工作顺利开展的要素集合,对非遗的保护与传承起着指导性作用。在党和国家的带领下,我国开拓和摸索非遗保护体制的建设和理论研究等方面到了新的阶段,但非遗保护机制的发展离不开该机制对非遗个案传承的作用研究。本文以非遗保护机制对传统手工艺传承的影响为研究对象,探讨并
研究表明近年来慢性病年轻化趋势明显,青年群体的健康告急,同时意外性损伤和劳损等问题频发,使得青年群体对康复护理用品愈加关注、对康复的需求更加迫切。康复护理用纺织品对此类型青年患者具有很好的康复辅助和护理作用,其体验的好坏直接或间接影响患者的康复效果,然而调研中发现目前市场康复护理用纺织品的设计水平参差不齐,对用户体验的考量有待提升。青年群体独立意识较强、个性多样化,基本的功能层和千篇一律的产品已无
随着乡村建设的快速发展,乡村地区对电能的需求快速增加,因而电力设备的绝缘性能面临更为严峻的挑战。变压器作为电力系统中核心的电力设备,具有转换电压等级的重要作用,一旦发生故障,会带来极大地损失,所以提升变压器的绝缘性能,使其能够安全、稳定的运行,是保证农网安全运行的关键。植物油作为一种新型的液体绝缘介质,具有可再生、生物降解性高、无毒和无污染等优点,契合我国“双碳”目标,而且植物油具有比矿物油更高的
随着我国经济的飞速发展,政府投资非经营性项目的规模越来越大,项目管理质量、项目建设成果、资金使用等问题得到了越来越高的关注度。长期以来,我国政府投资建设项目一直沿用计划经济体制下的“自建自用”方式,其弊端已对市场经济的健康发展产生了很大的影响。《国务院关于投资体制改革的决定》于2004年7月发布实施,不仅对非经营性项目“代建制”进行了确定,同时也进一步引导全国对政府投资非经营性项目的代建管理模式进
儿童承载着国家的未来,但由于其幼弱、易发病的特点及对医疗需求的特殊性,使儿童社会医疗保险成为了我国医疗社会保障体系中极为重要的方面。自改革开放初期至2007年全面覆盖社会医疗保险制度的实施,儿童社会医疗保险曾一度被排除在社会医疗保险之外,经历了一段空窗期;而随着十九大“健康中国战略”的实施到二十大的“健康中国建设”的推进,儿童社会医疗保险将迎来新的机遇和挑战。本文以福利经济理论、公共产品理论为研究
优质的营商环境是一个国家或者地区经济实力和竞争能力的重要体现,是企业生存发展的土壤,税收营商环境作为营商环境的重要组成部分,在经济活动中发挥着举足轻重的作用,越来越受到各方重视。特别是在当前疫情反复波动形势下,国内经济面临供给冲击、需求收缩、预期转弱等三重压力,对基层税务部门优化税收营商环境提出了新的更高要求。本文以新公共服务理论、政府职能理论、整体性治理理论为基础,结合重庆市忠县经济社会发展现状
我国房地产行业不断发展,在国民经济中占据重要地位。作为典型的资金密集型产业,房地产不仅需要足够的资金支持,还对资金链的良好循环有较高的要求,但近年来在国家加强监管、不断去杠杆、加之信用紧缩的背景下,我国房地产企业融资渠道受到限制,探索新的融资方式来应对行业下行风险对于房地产企业至关重要。房地产投资信托基金(REITs)在国外已有比较丰富的实践经验,我国市场对于REITs的呼声也在不断高涨,相关的研
全面实施乡村振兴战略,是国家制定的新时期我国现代化建设征程中的一项重大使命。产业振兴是乡村振兴的基础,实现产业振兴需要农村产业融合的充分发展。农村产业融合发展需要农业生产、加工、销售、物流等各环节的相互配合,更需要所涉及产业的衔接、互补、融合。在乡村振兴战略的大背景下,县级地方政府能否充分发挥自身职能职责,充分调动各市场主体的能动性,主动参与到农村产业各环节,并由此产生的实际效果优劣,直接关系当地
基因调控网络是一种基因与基因产物之间形成复杂相互作用关系构成的特殊网络,是人们了解生物过程和基因功能的重要工具,它代表了大量基因被转录因子调控并最终转化为蛋白质实现生物功能的复杂信息。现阶段研究人员已经提出了数量非常多、类型非常丰富的基因调控网络重构方法,为分析基因功能提供了指导信息。但是这些方法只能重构出静态的调控关系,无法从时间维度来推理出基因调控的演化过程。基于此,本文结合神经网络和复杂网络
近年来,国内外越来越多的企业开始涉足自动驾驶技术的研发,随着自动驾驶技术变得越来越成熟,对于具有自动驾驶功能的汽车上路前的检测要求也越来越高。为了满足这些严格的检测要求,对自动驾驶功能进行检测时可以采用一种新型的利用远程视觉反馈控制的无人驾驶车辆,这种车辆由驾驶者通过远程驾驶系统进行操控,模拟并制造出各类交通险情来对自动驾驶功能进行安全性测试。远程视觉反馈控制的无人车主要技术包括视觉信息和远程控制