稀疏组Lasso方法在个人信贷风险评估中的应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:vensen_guo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网金融等行业的快速发展,人们的消费理念发生了巨大的改变,信用消费已成趋势,与此同时越来越多的互联网金融企业研发并推出了自己的个人信用消费产品,类似于京东白条、任性付(苏宁易购)、蚂蚁花呗(阿里巴巴)等等。中国是一个拥有14亿人口的经济大国,从而形成了庞大的信贷市场,据《2017中国消费金融创新报告》预测,中国到了2020年的全年消费信贷金额可以达到惊人的12万亿元人民币,一举成为世界范围内最大的消费金融市场。由于目前我国互联网金融尚处于起步阶段,信用风险管理模式还不成熟,如何对申请贷款客户的信用进行合理评估是各大金融机构避免风险的关键,建立科学的个人信贷风险评估模型能够帮助金融机构有效地规避潜在风险。对个人信贷风险评估结果产生影响的因素可能有许多,例如年龄、国籍、家庭收入、学历等等,正确选择主要影响因素作为变量进行建模是提高模型预测准确率和增强模型可解释性的前提。目前常用于变量选择的方法主要有最优子集选择法(Subset Selection)以及系数收缩方法(CoefficientShrinkage)。其中Lasso方法可以作为系数收缩方法的代表,该方法能够连续地进行变量选择,其在完成变量筛选过程的同时也获得了参数的估计,能够有效克服最优子集选择法进行选择变量时不稳定等缺点。但是Lasso方法无法处理具有组效应的变量选择问题,而组Lasso方法(Group Lasso)又只能进行组水平变量选择,无法进行组内变量选择,为了解决这个问题,Friedman等人综合了Lasso和组Lasso方法的特性提出了稀疏组Lasso方法(Sparse Group Lasso),该方法既能在组间进行变量选择又能使组内变量具有稀疏性。本文首先对用来解决变量选择问题的两类主要方法——最优子集选择法和系数压缩方法进行了详细介绍,接着研究了稀疏组Lasso方法在线性回归模型框架和Logistic回归框架下的理论推导,并分别与基于Lasso方法和基于组Lasso方法的Logistic回归模型进行对比模拟实验,说明其在模型选择方面的优越性。最后,我们把稀疏组Lasso-Logistic模型应用到了个人信贷数据中,通过对实证结果进行分析,说明稀疏组Lasso-Logistic模型在个人信贷风险预测上具有良好的表现。
其他文献
目的:制备一种环保型蓄冷剂,并以现摘草莓为包装对象加以包装应用。方法:以甘露醇溶液与碳酸钠(Na2CO3)溶液为主储能剂,硼砂和羧甲基纤维素钠(CMC)分别为成核剂和增稠剂,加入
目的:探讨中医护理方案在中风病(脑梗死恢复期)中的应用效果。方法:对2014年7-12月我院收治的76例中风病(脑梗死恢复期)患者给予中医护理方案。结果:中医护理方案可以显著提高临床疗
西吉县荞麦生产栽培措施的探讨宁夏西吉县畜牧局(756200)马尚明荞麦是西吉县古老的传统优势作物之一。年最高种植面积1.3万hm ̄2,占全县粮食作物总括面积的17.1%,年产量占全县粮食总产的16.2%。近年来,随着
城中村改造是一项涉及多个相关主体的工程,规划如何协调好各方需求并实现共赢,是改造工作顺利进行和最后获得成功的关键。本文通过分析广州市琶洲村改造规划,在如何与上层次
纵观表面增强拉曼光谱(SERS)技术的发展进程,近十几年来,SERS技术的飞跃与纳米技术和纳米材料的蓬勃兴起是分不开的。基于纳米光学敏感材料与传感技术相结合的SERS检测作为一
针对当前方法存在准确率较低,误检率较高,检测时间较长,以及抗干扰性较差的问题,提出基于激光扫描的智能交通系统中运动目标检测跟踪方法,利用激光扫描传感器区分智能交通系
研究背景:Kupffer细胞(Kupffer cells,KCs)内毒素耐受现象与全身炎症反应综合症等临床感染性疾病的发生密切相关。抑制巨噬细胞中核转录因子κB(nuclear transcriptional fac
就《内经》中的胃咳做专篇讨论,从肺胃的生理联系与病理变化、后世证候理论发挥、证候分类与治则治法三方面论述,在全面总结历代医家理论研究与治疗经验的基础上,归纳出胃咳
槟榔屿乔治市的中文路名藉由华裔市民口耳相传的方式而流传不辍,更经由长久传承和集体创作,使得中文路名系统有别于官方颁布的英文路名系统和马来文路名系统。本文以槟榔屿乔
区位论是经济地理学的研究方法之一,本文在阅读相关参考文献的基础上,提出旅游区位论的概念,接着从客源市场和交通条件、区域经济发展水平、城市旅游感知形象、空间集聚和竞