基于RB-gcForest混合模型的个人信用风险评估研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:muteng12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国普惠金融战略的推进,信用经济成为新的经济增长点,消费信贷作为信用经济的主要表现形式,在我国得到了快速发展,也逐渐成为银行等金融机构新的利润增长来源和业务转型方向。但是随着消费信贷市场竞争日趋激烈,行业风险管理水平低下、不良贷款率过高等问题开始逐渐凸显,2015年后国家就开始加大了对银行等金融机构的信用风险的防范管理水平的监管,因此为了保证银行等金融机构小额信贷业务能够实现良性的运转,积极建立一套完善而有效的信用风险评估模型以期合理量化借款人信用风险具有重要的研究意义。近年来,针对信用风险评估问题,学者们利用统计方法和机器学习等技术构建信用评估模型,涌现出了一大批优秀的研究成果,极大丰富和完善了信用风险评估理论。然而通过对国内外个人信用风险评估研究进行系统梳理,本文发现当前信用评估模型仍然存在几点不足:一是模型精度较低。目前大多数的模型主要基于简单的统计方法和机器学习技术,无法深刻反映和拟合信用数据特征中存在的复杂映射关系。二是评估模型在不平衡数据中处理效果不佳。鉴于信贷业务中违约样本数量要远远多于非违约样本数量,信用数据天然存在较高的类别不平衡比率。然而大部分分类算法在面对不平衡数据时,倾向于拟合数量占优的非违约样本,导致评估模型对违约样本拟合能力不足,现实针对性较差。最后,评估模型可解释性较差。目前关于信用评估模型的研究主要追求模型预测精度的提升,而忽略了模型在现实应用中的可解释性问题。根据相关监管部门要求,金融机构在开发信用评估模型时,不仅要注重模型的预测性能提升,还要关注模型的可解释性分析。针对以往研究的不足,本文基于深度森林(gc Forest)和随机平衡采样(Random Balance,RB)算法,从数据层面和算法层面构建了预测精度高、不平衡数据适用性强、可解释性更好的个人信用评估模型,本文内容如下:首先,针对数据不平衡问题,本文应用了RB算法对不平衡信用数据进行预处理。RB通过混合采样随机生成与原来样本集大小一致但是不平衡比例多样化的新样本,从而实现对数据的预处理.通过随机性和重复性增加了数据的多样性,进而结合本文使用的gc Forest算法,保证了基分类器的多样性,最终提升了模型的泛化性能;其次,为了构建精度更高的模型,本文对gc Forest算法进行了改进,将分类能力较强的XGBoost模型嵌入gc Forest级联结构之中,在维持原有复杂度不变的同时,增加了模型的差异性,构建了一个低方差和低偏差的模型,提升了模型的分类精度;最后,本文对模型进行了专门的可解释性分析,利用特征重要性分析从全局维度分析了哪些特征普遍来说对违约与否会产生影响,从而揭示模型的分类逻辑。同时,本文还引入LIME算法对信用评估模型的局部可解释性进行分析。LIME算法对特定观测值的分类结果进行解释,详细说明了某个特征对预测结果的影响程度,增加了模型的透明度和可信度。为了验证本文提出的RB-gc Forest混合信用评估模型的有效性,本文基于某金融机构的个人信贷数据进行了实证研究。在模型评价指标上除了常规的准确率指标,还选择了用于对不平衡数据评价的F1值和AUC指标。同时,本文将提出的模型与其他常用的信用评估模型进行了对比,实验结果显示本文提出的改进的gc Forest模型在F1值、AUC、正确率上显著优于传统信用评估模型。此外,为验证RB算法在不平衡信用数据处理上的优越性,本文还对其他常用的不平衡处理办法与RB算法进行对比研究。最后,通过对RB-gc Forest模型进行可解释性研究发现,年龄、借款期限、学历等特征对借款人违约与否有较大的影响,LIME模型对测试集数据集中任意选择的三个客户样本进行分析,获得样本属于每个类别的概率值并基于结果对分配概率的原因进行了说明。本文构建的信用风险评估模型无论从精确度上还是可解释性上都要优于传统的信用评估模型,因此可以更有效地为银行等金融机构提供信用评估决策支持。根据实证研究结果,文章的最后给予了相关政策建议。
其他文献
在现代投资者心理分析中,将心理学与行为学引入到有效市场假说中进行研究已经成为一种趋势。在证券市场,投资者是非完全理性人,投资行为受投资者知识储备、个人偏好、外部环境等的影响始终存在,给公司业绩造成一定的影响。在目前已有的研究中,一些结论是不考虑投资者非理性因素下提出的有效市场假说,这导致结果过于理想化,与实际存在较大差异。而考虑非理性因素的研究,在名称方面的研究成果主要是从公司名和股票名两个方面展
学位
信用债是我国金融市场中重要的一种间接融资工具。自1984年首只信用债发行以来,信用债市场规模在这三十多年的发展中实现了快速增长,债券种类也愈发丰富,债券发行主体覆盖面愈发广泛,债券投资者队伍也不断壮大。市场中的企业债、公司债、中期票据、短期融资券以及非公开定向债务融资工具和资产支持证券给实体经济提供了更多元的融资方式与途径。过去的2021年,我国信用债发行总额达16.15万亿,创下2017年以来的
学位
目的 探究非那雄胺联合经尿道前列腺等离子电切除术治疗前列腺增生患者的临床效果。方法 选择2020年1月-2021年10月本院收治的80例前列腺增生患者,随机平均分组。对照组患者40例采用经尿道前列腺等离子电切术进行治疗,试验组40例采用非那雄胺联合经尿道前列腺等离子电切术进行治疗,在治疗结束后对比两组治疗效果,并对相关数据进行统计学分析。结果 试验组手术时间、术中出血量、术后住院时间、术后尿管拔除
期刊
为助推铁路建设项目绩效评价工作的持续开展,及时总结建设项目的得失,进一步改善项目管理,全面提升项目质量和资金使用效率,在参考和借鉴现有理论研究成果以及国内外实践经验的基础上,根据铁路建设项目的个性化特点,设计和开发其绩效评价指标体系。在此基础上,根据改进的层次分析法、加权平均法以及比较调整法,确定每一级指标的权重和分值,进而形成每个项目的评分值。分别以在建项目和完工项目为例,验证指标体系在实际应用
期刊
金融安全是国家安全的重要保障,是我国经济健康发展的前提基础,因此开展金融风险防范化解相关工作,是涉及到我国经济发展的重要事宜。《存款保险条例》的实施,标志着我国显性存款保险制度正式出台,意味着我国金融安全网愈发完善,有助于减少金融风险的发生,保持金融系统的稳定性。商业银行通过流动性创造向社会源源不断的提供流动性资金,促进国内经济循环,助力于双循环新发展格局的建设。但商业银行在进行流动性创造的同时,
学位
经过长期经济发展和技术进步的积累,2020年世界知识产权组织评估结果显示,我国终于迈入创新型国家行列。创新是一项特殊的投资活动,企业期望通过创新来巩固或提升自身核心竞争力,地区与国家经济发展的重要推动力也源于创新。在我国经济结构转型过程中,创新对企业实现转型升级和高质量发展的目标具有愈发重要的作用。上市企业发布财务报告,不仅是为了完成信息披露义务,还期望更准确地传达企业内部信息,向投资者传递管理层
学位
交通运输业是我国国民经济的重要基础,是具有战略地位的重要服务性行业,也是我国经济可持续发展的重要基础。目前我国高速公路上市企业的不少高速公路资产投资回收期即将结束,新建的高速公路资源大多属于加强自身高速路网的加密线路和联通其他高速公路路网的联通线路,这部分路产资源的营运收入远低于企业内的其他路产资源,导致我国高速公路企业难以实现良好的可持续发展,因此高速公路上市企业开展多元化经营成为一种内在的生存
学位
面对现代企业所有权与经营权相分离导致的委托代理和信息不对称问题,上市公司的信息披露制度便成为了连接市场和企业的关键纽带,高质量的信息披露能够为投资者传递积极信号,有助于其识别上市公司的投资价值进而合理做出相关投资决策,从而改善证券市场资源配置的有效性。同时,随着我国全面推进注册制改革脚步的临近,信息披露制度改革也亟待优化。另一方面,我国金融市场的对外开放速度逐渐加快,对合格的境外机构投资者(QFI
学位
随着经济全球化的不断推进,我国银行业也在不断开放,从一开始的限制外资的进入,到2018年银保监会正式取消中资银行外资持股比例限制,我国政府做出了很大的努力。对于银行业而言,不再是国有银行独大的局面,其他类型的银行也在逐渐壮大,我国银行业已经更加多元化,外资参股带来了先进的技术和管理理念,中资银行在不断学习和探索,根据我国国情做出适合的变革,但是,我国银行不良贷款率较高、公司治理水平不高的现状依然是
学位
我国经济从十八大以来开始走上提质提效的转型之路,经济结构和发展方式都在调整中不断完善,但非效率投资仍然是普遍存在的问题。有效的投资决策从微观上看是推动企业提高资源配置效率的重要源泉,直接影响着企业的盈利水平和经营风险,从宏观上看是持续优化经济结构,调整经济增长方式的必要路径,对深化资本市场改革有不可或缺的正向影响。在现代公司制度所有权和经营权互相分离的背景下,管理层对企业资源配置、经营治理起着重要
学位