基于非均衡数据处理和特征选择的信贷风险评估算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:lcp396526202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网金融的快速发展,许多银行机构和借贷平台暴露出越来越多的信用风险问题。信贷风险评估模型作为一种有效的工具,可以利用客户信息和客户活动数据识别潜在的风险,在金融机构中发挥着至关重要的作用。本文针对信贷客户数据海量、高维且类别分布不均衡的特点,对原始的信贷客户数据进行了均衡化处理和特征选择,并在此基础上建立了基于集成学习的信贷风险评估模型,实现了信贷客户的风险评估。具体研究内容及创新点如下:(1)提出了一种基于选择性混合采样的非均衡信贷数据处理方法。通过对信贷客户数据中不同类别的样本分布情况进行分析,分别对少数类和多数类的信贷客户样本进行选择性采样处理,解决了因信贷数据类别分布不均衡所导致的风险评估不合理的问题。实验结果表明,相较于SD_ISMOTE方法,该方法处理后的信贷客户数据将C4.5风险评估模型的F-measure值和G-mean值分别提高了6%和7%。(2)提出了一种基于多过滤器结合NSD(New Separable Degree)指标的信贷特征选择方法。通过从多个角度对信贷客户特征的重要程度进行度量和评估,避免了单一过滤器选择特征时,信贷客户特征的多方面信息容易被忽略的问题。实验结果表明,相较于单一过滤器的方法(SFS-LW),该方法选出的最优特征子集将信贷客户风险评估的分类精确率提高了11.8%;相较于多过滤器结合包装器的方法,该方法选择特征的时间效率提升了30%~80%。(3)结合静态集成和动态选择集成,提出了两种基于集成学习的风险评估模型:基于静态集成学习的FS-Bagging模型和基于动态选择集成的FBK模型,实现了信贷客户的风险评估。实验结果表明,基于动态选择集成的FBK模型在信贷客户的风险评估中表现最优。相较于Un-Ext-GDBT模型,该模型的AUC值提高了2%,ACC+值提高了2.5%。综上所述,本文提出的集成非均衡数据处理和特征选择的信贷风险评估模型,能够更加精准地实现信贷客户的风险评估。这不仅能帮助金融机构合理地规避风险,减少损失的发生,还能为实际的信贷风险管理提供有价值的指导。
其他文献
地域文化是特定民族对其所处生存环境的资源加以选择、利用和再创造的体现。地域文化定义了资源,但也不能离开资源抽象地存在。西江千户苗寨的地域文化非常独特,体现了当地苗族
液压凿孔碎石机由以下机构组成;在行走底盘上安装有能在空间内任意转动的机构,在此机构上设置有在被破碎物上进行凿孔的凿岩机和碎石器,它门安装在该机构的同一轴上,能绕此
<正>1前言破碎力是反击式破碎机结构设计和强度校核的重要依据。目前在冲击式破碎机设计时,一般是根据冲击速度和冲击时间,利用动量定理来计算出平均破碎力。但实际上,破碎机
会议
把新闻报道做成工作经验的总结、建设成就的展示,缺乏与新事物、新变动、新现象的联系,内容既不新鲜也无新意,削弱了新闻传播的主功能,因此,在报道理念上回归"新闻性"是做好
人才是社会发展最重要的资源之一。当今社会的竞争是人才的竞争,人才资源,尤其是政府行政人才资源的开发与利用已成为地方政府综合竞争力的关键构成。在这样的背景下,我国各
<正> 鉴史可以知今,纪念是为了未来。发轫于30年前十一届三中全会的改革开放,改变了中国,改变了世界。党的十七大系统总结了中国共产党和中国人民的奋斗史,特别是浓墨重彩地
随着市场经济的不断发展和医疗卫生体制改革的稳步推进,我国医院已基本实现了市场化运作,但其财务核算仍执行事业单位财务制度,本文就新时期如何改进固定产核算作如下阐述。
了解实习护生及护士心理健康状况的研究情况,为实习护生及护士的心理健康及心理干预提供理论依据。查阅相关文献,对国内外学者对实习护生及护士心理健康状况研究进行综述。国
文学作品必须是一个有机统一体,作品各内在因素必须"一致""统一""和谐",这一观点并没有充分的哲学根据和文学史根据。传统的经典作品也可能具有后现代性。《城堡》是一个分裂
早在《黄帝内经》中就对汗病的生理、病理等方面有许多宝贵的认识,如"阳加于阴谓之汗""五脏化液,心为汗"等。采用频数分析法,从药物类别、性、味、归经等方面,对收集到的158