模拟退火和集成算法在风控领域的应用研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:htcp6600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
消费金融公司是指不吸收公众存款,以小额、分散为原则,为中国境内居民个人提供以消费为目的的贷款的非银行金融机构。中国银行业保险监督管理委员会于2009年8月正式下达《消费金融公司试点管理办法》,开启了国内消费金融公司试点运营大幕。虽然我国消费金融公司的起步较晚,但其发展非常迅速,已展现出巨大的潜力。由于消费金融公司提供的个人信贷业务具有无担保、无抵押等特点,风险相对较高,银保监会因而设立了严格的监管标准。从保障消费金融公司自身的持续稳健运营的角度出发,建立一套行之有效的个人信用评价和风险防控机制已经成为当务之急。注意到传统的专家评分方法在处理消费金融公司大量的实时网络数据时存在效率低下、精准度难以保证等问题,考虑将时下热门的机器学习方法应用于消费金融领域的个人信用评价和风险控制。本文选取随机森林模型和Xgboost模型对消费金融公司的贷款客户进行逾期风险评估,并与经典的Logistic模型进行比较分析,实际数据分析的结果表明所采用的机器学习思想和方法在个人信用评估和风险防控领域具有相当的优势。本文的主要研究内容包括:1.介绍了数据的来源,并对数据进行了描述性分析,发现了一些有趣的规律,对于模型的构建所选用特征有了初步的指导作用。2.对数据进行清洗,首先删除缺失率比较高的变量,然后再剔除异常值。3.进行特征衍生和特征筛选。在特征衍生过程中,主要依据业务逻辑与数据逻辑这两条准则进行特征衍生。本文采用模拟退火和贪心算法对特征进行筛选,这也是本文的创新之处,采用这种方法的优点是可以跳出局部最优,效果比较好,运算速度比较快。4.选取Logistic模型、随机森林模型和Xgboost模型分别建模,并比较它们的精确性,发现Xgboost模型的精确性最好,随机森林模型次之。提出按比例加权求和的方法来融合随机森林模型和Xgboost模型,并验证其可提升模型的精确性。在模型的评价方面,本文采用了ROC曲线和AUC值。
其他文献
化石燃料日趋枯竭,寻找无污染可再生的新型能源已经成为当今社会的一项重大课题。燃料电池技术利用氢能,是当今众多新技术平台中较为高效、洁净的一种。通过燃料电池可以将氢
元素周期表中前几个3d过渡金属氮化物是一类被广泛利用的硬质材料,可用于制造各种切削和加工工具。之前已经很好的理解了第4族碳氮化物的硬度起源.这与金属d轨道中的eg电子和
随着移动机器人在农业领域内广泛的应用,由于其复杂不规则的地形以及多变的环境对移动机器人的运动控制和稳定性提出了更加严格的要求,因此如何提高移动机器人对于复杂多变的环境的自主优化能力成为了众多学者研究的热点。针对移动机器人传统的路径跟随控制方法需要人工调校参数,缺乏自主优化能力的问题,本文对此提出了一种基于自适应动态规划(ADP)的路径跟随控制方法。本文重点研究了对于在不同线形的参考路径下,移动机器
蛇六谷是上海地区魔芋的俗称,为治疗肿瘤的特色药材之一。目前蛇六谷研究大多集中在中药水煎剂,同时大多研究直接采用提取物进行实验,未进行分离纯化,活性物质成分不明,不利
近几年来,虚元法在偏微分方程数值求解中被广泛应用并以其独有的特点占据优势,其中最典型的应用为一般二阶椭圆方程与非线性抛物方程.本文主要研究虚元法求解非线性Schr(?)di
斜拉索是一种低阻尼、低质量、抗弯刚度及抗压刚度很小的柔性构件,超大跨度斜拉桥拉索的刚度及自振频率降低,发生参数振动的模态频率范围变宽,从而在外激励作用下极易发生大
脱落酸(Abscisic acid,ABA)在促进植物主根发育中起重要作用,但详细的分子机制有待阐明。E3泛素连接酶通过降解蛋白质参与调控植物的许多生长发育过程,但E3泛素连接酶RING家
煤炭资源开采引起地表沉陷灾害是制约矿区经济和生态环境可持续发展的瓶颈。不同倾角的煤层开采,采煤沉陷特征各不相同。本文以红石湾煤矿为地质原型,运用数值模拟实验、相似
在无外场时,自由电子杂乱无序的分布在金属导体内部。若给导体加上外电场,无序的自由电子就会在静电力的作用下朝着统一的方向移动(电子的定向移动)。光波是电磁波的一种,其
浮游生物在海洋生态系统的能量流动中起关键作用,其中浮游植物是水生生物食物链的基础,营养物是浮游植物生长的重要资源.本文利用反应扩散方程理论研究在齐次Robin边界条件下