一种基于Boosting算法的新模型在银行信用评级中的应用

来源 :北京交通大学 | 被引量 : 14次 | 上传用户:maomao11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
银行拥有大量的信用贷款数据,大数据时代运用信用评分模型去准确地判断申请人的信用风险是未来发展的趋势。在实际的信用评分数据库中,信用好的申请者通常都比信用不好的申请者多很多,从而导致了数据集的不平衡,而机器学习在不平衡数据集上的训练往往对小类的识别率比较低,错误地给予信用不好的申请者贷款会给银行带来巨大的商业危害,因此提高分类器对小类的识别至关重要。本文提出了一种基于混合重抽样和Boosting算法的新模型HSBoosto第一阶段,对不平衡数据集进行混合重抽样处理,从而获得平衡的样本训练集;第二阶段,利用Boosting算法更改容易被错误分类的小类样本的权值,从而来提高分类器对小类样本的识别能力。本文利用UCI数据库的信用评分数据集,运用HSBoost算法做实证分析,用SVM、BP神经网络、DT作为基本分类器,对比已有的RUSBoost算法、SMOTEBoost算法、混合重抽样技术和两种基本重抽样技术,验证了HSBoost算法的有效性和可行性,提高了分类器对小类的识别率。同时利用非参数Wilcoxon配对符号秩检验,证明了HSBoost算法显著优于SMOTEBoost算法。
其他文献
电场强度是物理学的重要概念,准确的理解是应用的前提。本文通过几种不同的解题方法的展示,希望能帮助读者对电场强度有近一步的理解。
为了能够更好地研究洛维大桥连续箱梁挂篮悬浇的施工要点,本文在详细了解工程概况的基础上,从挂篮的设计安装与试压、主梁悬浇方案以及合龙段箱梁施工三个方面进行了有关探讨
公路路基需要对路面上各种荷载进行承担,因此保证路基工程的稳定性以及安全性是至关重要的,这样也才能够充分保证公路工程的各种功能得以发挥。在公路路基设计工作中,存在着
【正】一、北京市"两带"人口结构及发展形势1."两带"①户籍人口、年龄性别结构根据2009《北京区域统计年鉴》数据,2008年北京市东部发展带户籍人口232.8万人,西
数学建模是用数学知识解决实际问题的具体体现.高中数学教学中,提升学生的数学建模能力,不仅有助于学生深化对数学模型的理解,而且还能很好地提高其解题能力,因此,授课中应注
从人口发展的角度,借鉴“治理”理论,提出“人口善治”的治理方略是极富理论意义和实践价值的。本文提出“人口善治”的基本特征是合法性、透明性、法治性、互动性;在主要内
为探讨严重急性呼吸综合征(severe acute respiratory syndrome,SARS)进行有创机械通气的治疗策略,在常规治疗和无创通气失败后,对8例重症SARS患者[男5例,女3例,年龄30~74岁,
超声诊断髂静脉至右房巨大肿瘤1例第四军医大学西京医院超声科李军,钱蕴秋,王东鸣患者女性。年龄33岁。1988年因子宫肌瘤行子宫次全切除。1992年起出现间歇性晕倒。经外院确诊为右心房粘液
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
习近平同志的生态政治观,既是马克思主义生态政治思想的传承创新,也是当代中国生态政治实践经验的科学总结,历史地形成了生态本原观、生态动力观、生态价值观、生态民主观和生态