基于机器学习的信用评分模型研究

来源 :天津商业大学 | 被引量 : 7次 | 上传用户:buebuewong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用个人历史贷款行为数据对用户未来的信用表现进行预测一直是互联网金融领域广大学者关注的热点问题。为此,本文以某贷款机构的历史贷款数据为例,通过构建信用评分模型并建立信用评分体系来预测用户的违约情况,降低用户的违约风险。首先,对贷款数据进行数据预处理和指标筛选。数据预处理主要解决数据的无效性、集中度高、缺失值、异常值以及不一致性等问题。在考虑变量的预测能力和变量之间的相关性的基础上,采用Ⅳ值筛选法和相关性检测相结合的方式进行变量的筛选。第一步,对变量进行WOE分箱并计算Ⅳ值;第二步,对Ⅳ值低于0.02的变量进行剔除;第三步,进行相关性检测,对相关系数超过0.6的两个变量进行筛选,保留Ⅳ值较高的变量。最终选取11个变量作为信用评分指标。其次,利用信用评分指标建立信用评分模型。选择传统的信用评分模型—Logistic回归和精度较高的XGBoost算法进行建模,以AUC和KS作为评价指标对模型进行评估和对比。实证结果表明,XGBoost模型(KS=0.3290,AUC=0.7181)在KS和AUC的表现都优于Logistic回归模型(KS=0.3129,AUC=0.7052),因此选择XGBoost作为最终的信用评分模型;由XGBoost模型输出的变量重要程度排名得知,收入对客户是否会构成违约行为起着重大的作用,同时贷款或贷记卡合同金额、贷款提前还款月数、教育水平也具有重要影响。最后,利用对XGBoost模型的预测结果建立评分卡,将得到的信用评分从高到低划分四个信用评分等级:A、B、C、D。其中D等级用户违约概率超过50%,属于违约高风险人群,对于这类用户应该拒绝贷款。
其他文献
过渡金属具有d电子容易得失电子表现出多种化合价,有较强的催化性能,稀土元素具有特殊的电子结构(含有4f层未充满电子)表现出异于d区过渡金属元素的特性。近来的研究表明杂多化合
本文主要研究了两个方面的内容:1、pH值对聚四氨基酞菁钴(p-CoTAPc)膜电化学、电催化及紫外光谱性质的影响。2、四氨基酞菁铜与苯胺共聚物的制备及性质的研究。在研究中运用了
钨酸铅晶体是一种新型无机闪烁材料,本文切割并用X射线衍射法定向了用改进的坩埚下降法生长的两块无色透明钨酸铅晶体。用群论分析了两种有争议的钨酸铅结构类型的振动模式,采
“四个全面”是引领民族复兴的战略布局,开辟了党治国理政的新境界,指明了中国特色社会主义伟大事业和党的建设伟大工程的新方向。在新时代的历史方位与历史起点上,要以社会主义
<正>泄露年龄秘密的不仅是眼角、颈部,还有你的双手。双手承载了日常生活中的大部分工作。然而不少人都在不经意间忽略了对手部的保养——长时间使用碱性成分大的肥皂洗手、
本文建立了四(4-羧基苯基)卟啉(TCPP)的电分析方法。在0.1mol/LNa2HPO4-KH2PO4(pH7.0)的支持电解质溶液中,采用单扫描极谱法发现了CPP在—0.70V(vs SCE)有一峰形较好的线性扫描还原峰
本文首先综述了铅合金电极的研究现状及其在有机电合成中的应用,根据其目前存在的问题,从冶金学原理和电化学原理的角度出发,设计了实验合金。采用金相结构分析、硬度分析以及电
<正>心理效应是指人在特定的情绪和环境条件下,某些心理和行为出现的规律性反应。在人民调解工作中,结合纠纷的不同性质和内容,充分运用心理学知识,选择适当的调解方法,会达
非水体系由于其较宽的电位区间和液相范围且是多种物质的良好溶剂,所以在电化学研究中一直是人们的不辍选择。随着谱学技术的发展,人们得以能够从分子(原子)水平对各种电化学界面
抽象的概念展示了社会现象的丰富内涵。自雇、自主经营与创业概念共同揭示了市场经济中的个体经济活动特征,但研究过程中的互换使用、不统一等模糊了它们之间的异质性。同作