基于改进BalanceCascade方法的信用评分集成模型研究

来源 :兰州财经大学 | 被引量 : 0次 | 上传用户:yukeno1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着消费金融的迅猛发展,个人信贷业务也快速发展起来,不仅各种网贷平台增多,而且贷款品种也逐渐丰富,几乎涵盖了个人生产和生活的方方面面。然而来自信用风险的挑战也日趋严峻,通过对申请人信用评分进行风险评估显得尤为重要。目前,虽然有较多的信用评分模型,但不同模型各有优劣。以往的研究发现单一模型训练速度较快,但预测精度与稳定性差;若能够选取合适的基分类器进行集成,可在一定程度上降低预测误差,提高准确性;并且在实际过程中,由于信用评分数据集自身局限性,正负样本类别差异极大,不平衡问题的处理对模型性能也有重要影响。基于以上问题,本文进行了如下研究:本文利用随机森林方法进行特征选择,该方法在拟合数据后,能够对所有特征属性进行重要性度量,相较于金融风控中常用的信息值的特征选择方法避免了对每个特征的分箱操作,可直接获得特征重要性排序,实现更为简单,选择特征的速度更加高效;根据特性重要性排名与业务逻辑,最后选择重要性大于0.1的特征,一共选取27个特征作为入模变量。为检验不同类型模型在实际中的应用情况,选取逻辑回归(LR)、决策树(DT)、朴素贝叶斯(NB)与支持向量机(SVM)四种在信用评分分类预测性能较好、认可度较高的单一模型进行实验;之后分别以LR、NB、DT、SVM四种单一模型分别为基分类器进行Bagging集成,检验同质集成模型的分类性能;根据不同的基分类器进行集成可以相互补充,提高信用评分模型分类预测的精度与准确性,为检验实际分类效果,以LR、NB、DT、SVM四种性能较好的分类算法为基分类器,通过bootstrap进行抽样构建数据子集自适应投票选择AUC最高的基分类器进行集成,构建一种新的异质集成模型进行实验。针对信用评分数据集中正负样本类别不平衡性问题,提出了一种改进的Balance Cascade方法,该方法通过抽取正类样本与负类样本构成平衡数据集训练Adaboost分类器,将分类错误率控制在一定范围内,确保移除正类样本的准确性;之后根据正负样本的不平衡比例,设置一个可调参数,通过不断移除一定比例的正样本,使得剩余正负样本比例接近此参数,对不同正负样本比例下的数据集进行实验,结合新的分层模型进行训练,寻找最优的比例参数。由于RF与XGBoost在信用评分中准确性方面具有的较大优势,所以选择RF与XGBoost作为第一层的基分类器,而第二层模型不应太复杂,太过复杂的话可能会导致模型在训练集上过拟合、泛化效果差等问题,所以该层模型选用较为稳定的单一模型逻辑回归为基分类器,通过在阿里天池竞赛上的信用数据集实验结果显示,当正负样本比例设置为2时,基于改进Balance Cascade方法的信用评分集成模型准确率达到0.80,精确率0.90,召回率为0.84,F1值为0.88,AUC值0.74,相较于单一分类模型、Bagging集成模型、自适应选择AUC的异质集成模型,基于改进Balance Cascade方法的集成模型效果更好,更加稳定。
其他文献
自党的十九大以来,我国“放管服”改革取得了明显成效。在如此的大环境之下,深入推进行政审批,有利于稳定的对政府职能进行转变,弱化制度性的交易成本,促进市场资源获得高效率的配置,营造良好的营商环境,为经济社会的高质量发展保驾护航。国家审计作为政府监督管理的重要方式,对推进行政审批改革政策全面落实方面具有无可代替的作用。2015年来,在国家审计署的领导下,各级审计机关共同展开“放管服”政策执行跟踪审计审
学位
“十四五”开局之年,中国资本市场改革不断深入,多措并举提高上市公司质量成为重要任务,扮演着重要角色的注册会计师行业作为推动资本市场迈向高质量发展新时期中的关键一环,发挥着重要作用。与此同时,为迎合国家高质量发展为主题的大趋势,无论是投资者、债权人,亦或是政府监管部门,都迫切需要高质量的会计信息来指导未来的决策。但近年来,随着会计师事务所审计失败案件不断被爆出,上市公司会计信息质量深受社会公众质疑,
学位
发展与环境本就是“舟水关系”,环境似水,发展如舟,水能载舟,亦能覆舟。2019年黄河流域生态保护和高质量发展上升为重大国家战略,2021年其规划纲要中要求加强黄河三角洲湿地的保护与修复工作,筹建黄河口国家公园。对黄河生态的保护和治理是该地域社会经济发展的重要依据。黄河流域是我国重要经济地区,也是我国生态文明建设的重要保护基地,对黄河流域的环境保护和治理,是关系我国经济发展、人民幸福的大事。环境管理
学位
十四五规划中习近平总书记重申高等教育对于国家发展的重要性,国家投入中央支持地方高校发展专项资金支持高等教育发展的力度逐年加强,政府、高校及人民群众对专项资金的投入产出效果进行了解的需求也与日俱增。我国的绩效审计仍在发展进步,相应的绩效审计工作尚不成熟,仍然存在一系列问题,例如体系不系统、缺乏审计标准,问责机制缺乏效果。绩效评价作为绩效审计工作的重要内容,对专项资金绩效评价的研究迫在眉睫。本文从T高
学位
上海和深圳证券交易所于2010年3月31日相继开通融资融券交易系统,标志着融资融券交易正式进入试点运行阶段。2019年8月19日,融资融券标的迎来了自两融业务开展以来的第六次扩容,标的股数量由950只扩大至1600只,市值占总市值的比重达80%。十年来,两融标的证券范围和规模不断扩大,融资融券业务取得了长足的发展,我国证券市场日趋成熟。融资融券业务在影响证券市场的同时,对上市公司的信息披露行为和利
学位
2022年1月1日起实施的《中华人民共和国审计法》(以下简称“审计法”)规定“审计机关应当向社会公布审计结果”,“审计机关和审计人员应当自觉接受社会监督、舆论监督。”这使得审计机关公开审计结果信息成为一项法定义务,保障了公民监督权的同时为社会公众进行社会监督、舆论监督提供了重要途径。2019年5月15日修订后的《政府信息公开条例》(以下简称“条例”)开始实施,对政府部门进行主动公开信息的主体、内容
学位
就业问题事关百姓福祉,对人民幸福感来说是不可忽视的一项指标。十九大之后就业工作提高至国家层次,就业是民生之压舱石、发展之金钥匙、财富之助推器已经形成普遍共识。每年两会均总结最受关注的民生议题,其中就业问题总有一席之地,是关注的重点之一。本世纪以来我国政府深入贯彻财政政策,为就业工作做出诸多努力,以种类众多的补助资金支持就业工作开展,希望就业质量迈上新台阶。对就业专项资金运用效果的监督是保证就业市场
学位
随着经济发达,采光开始成为体现人们日常生活品质中的一项主要技术指标,光照的强弱、采光范围的多少极大的影响着我们的生活。在当代,楼房的内部通风、采光和日照等问题已经成为了社会上越来越关心的课题之一。城市用地价值的增加、高楼大厦的增多,这些改变导致与采光和日照相关方面的问题也越来越多。因此,房屋市场价值贬值也成为了衡量采光权侵权补偿金额的一大重要依据。从相关文献中了解到,在我国现有的实践中,对于受采光
学位
随着我国改革开放政策的实施,我国政府制定了多项政策,同时也积极的加入各种国际组织,以此来支持我国企业积极加入到国际市场的竞争中去。在这种环境下,我国越来越多的企业开始实施跨国并购,成为此次全球跨国并购浪潮中的主战力。很多企业也通过这一活动所带来的协同效应,成功实现了跨越式的成长。但是也有部分企业实施的跨国并购活动并未实现预期目标。主要是由于跨国并购发生在两个不同的国家或地区,因此容易面临各种风险,
学位
黄河作为我国最主要的生态安全屏障,是我国人口活动和经济社会发展的重点区域。黄河流域涵盖着国家许多重点的生态功能地区,农牧业较好,水资源丰富,区域历史文化根基深厚,自然环境条件优越,经济、社会发展技术水平也较高,新的经济增长点也在不断涌现。显然,黄河流域已成为城市生态文明建设和经济高质量发展的良好基石,但黄河流域仍然面临生态脆弱、水资源短缺、洪水高发、高质量发展不全面和民生发展不充分等问题,而在此基
学位