基于贝叶斯优化的LightGBM模型在信贷信用评价中的应用研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:csdncsdn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2020年疫情的影响,我国的信贷规模快速增长;规模的增加随之而来的就是信用风险的增加。因此,采用新的方法来研究个人信用评价问题是很有必要的。本文结合实际业务的情况,采用了一个新的评价指标F-beta值,即在准确率与召回率融合时给予回率更多的权重。研究内容如下:(1)常用解决样本不均衡问题的方法是SMOTE算法构造新样本使样本均衡;本文给出了一种新的尝试,由于逾期数据少,未逾期数据多;我们可以把二分类问题转化成单分类问题,也就是异常值检测问题。利用阴性数据训练一个分类器得到一个界限;超出界限的就是阳性数据。(2)参数选择方法有经验法,遍历法两种。这两种方法在调参效果与运行时间上面各有优缺点;经验法可以根据以往的经验快速得到参数具体值,但是经验法有一个明显的缺陷,那就是无法得到最优的参数组合。遍历法可以得到最优的参数,但是其时间成本非常高。在这两者方法的优缺点上做一个折中,即这种方法的调参效果比遍历法稍差,减少时间成本。贝叶斯参数优化基于此而设计的。本文通过多个对比,单个模型的性能比较、同一模型在不同种优化算法下的性能、以及与其他机器学习算法的比较,最后得出结论。此外,还对变量进行特征重要性分析,找出对逾期影响最大的前五个变量进行分析,给出建议。
其他文献
随着资源能源的开发利用和能源存储面临着诸多问题,超级电容器作为一种新型环保的储能器件应运而生,成为了当前研究的热点之一。目前,超级电容器已广泛应用于各种电子产品、
过度放牧已成为导致内蒙古典型草原退化的重要因素之一,因此因地制宜地确定内蒙古典型草原适宜放牧强度已成为刻不容缓需要解决的问题。本文将内蒙古典型草原作为研究对象,建
在经合组织国家(OECD)中,鼓励市场R&D活动的财政补贴和税收优惠是普遍存在的。创新创业作为实现中国经济提质增效升级“双引擎”,已经成为国家战略。为提升本国高新技术产业
当前我国保险业正处于一个高速发展期,未来市场潜力庞大,吸引了越来越多投资者的关注,他们在选择上市公司进行投资时,首先考虑的指标就是市盈率。市盈率指标不仅是广大投资者辨别投资风险和投资价值、选择合适投资策略的重要工具,也是政府金融监管部门制定合理政策、引导资本市场健康发展的重要参考,而市盈率受到许多宏观和微观因素的影响。分析影响市盈率的因素,既能帮助投资者更理性地进行投资,还可以帮助投资者进行股票价
目的:探讨超顺磁性氧化铁纳米颗粒(SPION)作为基因载体负载miR-326抑制子宫内膜癌干细胞在小鼠体内生长及利用磁共振体内检测肿瘤大小的可行性。方法:通过透射电子显微镜和粒
2019年秋季,统编版高中思想政治教材开始在北京、上海等部分省市投入使用,其他省份也陆续跟进。用好这一国家统编、统审、统用的新教材,必须认真领会新教材的编写理念,把握新教材的特点,做到因地制宜,因材施教,有效推进高中思想政治课的教学改革。本文以《普通高中思想政治课程标准》(2020年修订)为指导,在对比人教版高中思想政治“综合探究”相关研究的基础上,对统编版新教材中的“综合探究”进行研究,为高中思
量化投资是一种泛指企业通过电子商务或者互联网等工具进行数量化的交易方式,并通过计算机的程序化制作发出买卖指令,以实现稳定的收益作为主要目的。在国外已经形成了较为成熟的体系,有着悠久的历史,因此倍受投资者的青睐,其规模和市场份额日益增大。对于国内,量化投资起步较晚,仅仅有十多年的发展,和国外量化投资产业相比目前仍处于起步和发展阶段,近几年来,经济和互联网技术的普及应用促进了其飞速发展,各大机构和公司
大型企业集团股权构架庞大,管理层级众多,内部管控难度高,一旦面临风险往往会出现“多米诺骨牌”效应,使整个集团陷入岌岌可危的境地,因此对集团内部的风险传染问题研究具有重要的现实意义。作为我国除华为之外最大的民营集团,海航集团却最终走向了破产重组的结局,其内部股权链、担保链、关联交易链错综复杂,债务问题也一直引发人们的关注,因此本文选取海航集团作为案例进行研究,深入探讨海航集团内部的风险传染问题。本文
在过去,由于传统金融机构的贷款申请的手续和审批程序复杂繁琐,很多企业和个人存在融资困难的问题。随着互联网金融迅速发展,使得审查的风险和借贷成本得以有效降低,传统的借贷的内部运作也越来越公开和透明化,因此小额贷款成为可能。网络借贷是指资金供需双方通过互联网平台实现的直接借贷,是互联网金融的重要组成部分。而在现今社会利用互联网平台存在的优势,其在我国金融行业里迅速成长。然而优势的背后也必然存在着大量的
本文主要通过期权及期权标的相关因子构建与期权价格的映射模型,在使用多元线性回归和支持向量机均无法使模型达到较好预测能力的情况下,使用了大数据技术中常用的集成算法随机森林,同时为了避免复杂非线性模型的过拟合情况发生,具体探讨了随机森林算法的参数设置。通过研究可以确定随机森林定价模型对期权价格变量和各个因子之间的非线性映射关系有出色的拟合能力。接着基于随机森林期权定价模型进行了期权模拟交易回测,采用两