基于TabNet的个人信用风险评估研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:lxr_hu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界经济的蓬勃发展和我国改革开放的逐步深化,信用卡支付已成为现代社会最常用的支付方式之一。作为一种不断增长的服务,如何评估其申请人是否能偿还贷款对于正确的支持金融机构去定义其政策与策略起着关键性的作用。在过去的几十年里,人们提出了许多方法来评估个人信用风险,但是要准确地评估信用风险还存在很多待解决的问题。其中一个问题是如何充分利用现有的无标签数据,从而减少标注成本,解决这一问题的关键技术是半监督学习。另一个问题是如何解决基于深度学习的评估模型准确率不高的问题,解决这一问题的关键是引入树模型的思想。信贷场景中主流的信用评估方法为评分卡,少量业务采用机器学习方法评估,信用评估的模型精度和技术的先进性拥有较大提升空间。在真实场景中,样本的标记需要消耗大量资源,所以大量没有类别标签的样本被浪费,这导致模型训练的过程中只能获取少量带有类别标签的样本。半监督学习可以充分利用未标记数据从而降低标注成本,丰富模型训练集,进而提高模型精度。TabNet在表格数据分析领域崭露头角,其结合了树模型和NN模型的特点可以指导信用风险的评估。通过研究,本文主要做了如下工作:首先,结合相关数据使用TabNet深度学习算法建立信用风险评估模型,结合实际场景进行优化。本文将TabNet模型构建的信用风险评估模型与树模型及CNN模型进行实验对比,实验结果显示初步优化后的TabNet模型在准确率上比对照模型表现更优秀;其次,对TabNet的特征和参数选择部分存在的问题分别进行研究与分析。使用遗传算法(GA)来优化TabNet的Attention Transformer自动特征选择模块,利用粒子群算法(PSO)优化TabNet的超参数选择,实现参数的自动搜索。分析遗传算法“早熟”问题出现的几大原因并进行验证,根据实验结果,对遗传算法进行进一步的优化;最后,引入半监督训练来改善样本数据。为解决信贷场景中常见的数据不平衡与数据标签缺失的问题,结合无监督预训练以及伪标签等技术,设计一种迭代加权半监督的训练方法,在训练过程中为无标签数据动态生成伪标签,扩充训练集数据,提升模型精度。综上,本文引入了TabNet模型评估个人信用风险,研究了模型特征和参数选择模块存在的问题,给出了模型的优化方向,结合了半监督训练方法,最终构建了一个基于TabNet的半监督信用风险评估模型。
其他文献
教师学习力是教师专业发展的重要途径。教师不仅是知识的传递者,也是教育工作者,教师需要不断提升,主动积极的学习,拥有终身学习的思维,教师的素质才能获得提升。若教师停止学习,除了很快被社会淘汰,也无法促进学生的发展。因此,本研究选择从所在的教育场所——马来西亚K中学为研究个案,通过K中学教师学习力存在的问题分析、了解问题背后的原因,提出提升策略,从而促进教师专业发展,建立优秀的教师队伍。本研究的主要问
学位
自从2000年末起,我国65岁以上人口比例高达7%,这标志着我国正式迈入老龄化社会。根据相关部门数据预测,“十四五”期间,全国老年人口将直接突破3亿人,这意味着我国将从轻度老龄化迈向中度老龄化。我国正在经历着人口结构的剧烈转变,人口红利逐渐减弱,人口老化速度加快等一系列问题,养老保障压力空前巨大。但人口老龄化的发展趋势不可逆转,因此探索并完善更合理的社会养老保障体系是我国迫在眉睫的重要任务。目前,
学位
改革开放以来,受益于我国经济的飞速发展和国内良好的政策环境,人民的生活水平显著提高,社会财富的总规模越来越大,我国高净值人群的数量与日俱增。根据招商银行和贝恩公司联合发布的《2021中国私人财富报告》显示,截至2021年,可投资产超过1000万的中国高净值人群预计突破300万人,可投资资产归规模将达96万亿。而随着现有财富创造主力军的“创一代”年龄日益增长,高净值人群的财富保值、增值、代际传承的需
学位
随着摩尔定律的不断发展和先进制程的进步,异质型FPGA电路的集成度越来越高,性能逐渐提升,在得到广泛应用的同时也带来了新的挑战。例如,相应的EDA工具需要同时考虑优化线长目标,满足密度、时钟约束,提升可布线性等多方面的要求。布局是FPGA后端物理设计中最重要的环节之一,由于传统的布局算法主要考虑线长优化,且在布局阶段无法快速获取布线拥塞评估,容易产生可布线性差的布局结果从而导致后续布线失败。另一方
学位
玉米作为全球三大谷物之一,不仅富含充足的膳食纤维、黄体素等营养物质,更是具备清湿热、延缓衰老、利肝胆等功效,对我国农业发展十分重要。但是在玉米种植业领域,大规模种植玉米需要及时把控玉米的生长状态,因此及时有效地监测玉米生长状态是十分重要的一环。传统的监测玉米生长状态主要依靠两种方法,一种是人工监测,但是这种方法属于经验性判定,不仅繁琐复杂、易出错、受主观影响大且效率低下,无法满足大规模培育玉米时精
学位
疫情的爆发,给国内很多行业带来巨大挑战,可以说危险和机会并存,例如电子商务行业。算法和大数据的运用,让整个行业运营效率得到有效提高,加上国家财政政策的支持,企业移动端的布局,网购市场规模持续扩大,推动了生鲜电商整体市场增长,但是行业面临的风险也是不容忽视,每日优鲜已宣布破产重组,钱大妈从北方市场悄然撤离,均诉说着企业面临的风险和承受的压力。A电子商务公司是为品牌方提供完整的产品开发,品牌营销,视觉
学位
根据2022年世界银行组织对全球金融市场规模最新统计数据显示,中国以超过12万亿(美元)的规模成为世界仅次于美国的第二大金融市场。中国金融市场的繁荣发展,吸引越来越多的投资者希望通过量化交易的投资的方式获取收益。然而,通过量化交易进行投资对于普通投资者来说存在三个困难:首先,面对众多不同的投资理论,量化交易模型复杂,投资者难以采用有效的方法获得收益;然后,数据采集和预处理容易出错,同时模型建立、开
学位
随着我国近代化进程的不断加快,汽车的数量大量增加,这也间接导致了交通事故的发生频率大大增加,因此自动驾驶技术引起了各大汽车厂商的愈发关注。基于深度学习的目标检测技术在自动驾驶的感知模块发挥着很重要的功能,但是随着目标检测技术的精度的提升,其网络模型也会愈发的复杂,庞大的训练参数则需要较高的硬件配置。由于汽车的车载系统性能有限,因此如何让目标检测算法在保持精度的同时,更加的轻量化则是本文的主要研究方
学位
目前国内工业品电子商务的发展还在刚起步的阶段,供工业品电商使用的高质量搜索引擎目前国内还有待研发,本系统的目的就是给工业品电商平台提供一个快速搜索工业品的系统,在满足工业品电商的业务需求后优化用户的购买体验。工业品垂直搜索引擎系统是出自上海鑫谊麟禾科技有限公司垂直搜索产品线的实际项目,属于中国传统搜索引擎行业。工业品垂直搜索引擎系统是以产品信息为基准,明确电子商务产品和其客户要求,进行针对产品的垂
学位
工业互联网时代,制造业企业对于效能提升的需求与日俱增。在面向市场的竞争中,快速响应生产需求变更的企业往往具备更强的灵活性。车间如何在各种约束条件下,针对不断变化的生产需求快速而弹性的制定生产计划,降低库存的堆积并节省运维的各项成本实现降本增效,是一个值得研究的问题。当下,大多数企业在车间生产的过程中缺乏科学的统筹规划,未形成具备体系的排程方案。车间作业调度问题(JSSP)作为车间排程系统的核心,也
学位