Logistic回归及其相关方法在个人信用评分中的应用

来源 :太原理工大学 | 被引量 : 20次 | 上传用户:Ipomoea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着经济的快速发展,人们的消费观念也随之改变,人们越来越倾向于提前消费,越来越多的人向银行或者商业公司等金融机构申请贷款,申请人往往关心能否被授予贷款。银行等金融机构则关注申请人是否能按事先约定的时间偿还贷款,他们应用信用评分模型来作为评估个人信用评分的工具,判断是否将贷款授予申请人,同时预测申请人是违约顾客还是信誉顾客。如何将银行等金融机构的损失降到最小,使利润获得最大,是信用决策者一直关注的问题,因此,建立合适有效的信用评分模型显得尤为重要。本文采用非平衡个人信用数据,在对非平衡数据进行预处理时,采用重抽样方法中的随机过抽样方法,应用模型选择影响个人信用评分的因素时,采用传统的Logistic回归方法,以及在Logistic回归方法上进行改进的Lasso-Logistic回归、Adaptive Lasso-Logistic回归三种方法,Lasso-Logistic回归在似然函数上加了惩罚项,Adaptive Lasso-Logistic回归在惩罚项上加权重,对不同的回归系数给予不同的惩罚,即用适应性的权重来惩罚不同的系数,在计算系数权重时,Adaptive Lasso-Logistic回归方法分别将极大似然估计和岭估计作为最初的估计,通过对个人信用评分数据的分析,以最小误分类错误和预测精度作为衡量标准,并采用ROC曲线进行验证,分析比较几种方法在信用评分中的预测结果。通过对信用数据应用上述几种方法,实践结果表明,Logistic回归及其改进的方法都具有很好的稳健性和可解释性,相比较而言,Logistic回归的预测精度确是最低的,而误分类错误也是最高的,由于Lasso-Logistic回归在Logistic回归方法上进行了惩罚估计,其选择了相对较少的变量,降低了模型的复杂度,并且提高了模型的预测精度,减少了误分类错误。Adaptive Lasso-Logistic回归方法给予每个系数适应性的权重,最初估计选用极大似然估计时,模型表现出最好的预测精度以及最低的误分类错误,同时第I类错误和第II类错误也都降到了最低。而选用岭回归作为最初估计时,表现仅次于采用极大似然估计时,无论是分类准确性还是预测准确性都较Lasso-Logistic回归高,第I类和第II类错误,以及总的误分类也低于Lasso-Logistic回归。
其他文献
图书破损问题是图书保护中遇到的一个重要问题,由于多种因素,图书破损在所难免,在一定程度上影响了图书的流通。分析了图书破损的原因,探讨了加强图书保护的重要性,提出了保
<正>通过商业保险公司开办食品安全责任保险,既能保证食品安全事故中的受害人得到及时的补偿,又可以减轻政府的财政压力,这对于辅助政府社会管理功能的实现具有积极的意义。
<正>有利条件(一)有利于维护金融体系的稳定。近10年,随着不断加速的技术进步和金融创新,使金融机构原有的竞争格局发生了重大变化,金融业混业经营渐成潮流。金融风险也已演
目前,中国很多开发区已经从最初的纯经济功能区演变为一级政府或准政府。以中国三个典型国家级开发区为例,对中国开发区管理体制演变历程进行回顾,总结出中国开发区管理体制
随着信息爆炸时代的来临,专业服务型企业面临市场同质化的巨大威胁,与此同时由于缺少与用户的直接沟通,也不能及时有效地了解客户面对的问题。基于此,介绍了专业服务型企业的
那坡地处中越边境,属云贵高原余脉六韶山南麓,位于东经105&#176;31′~106&#176;05′,北纬22&#176;55′~23&#176;22′之间,北回归线穿越而过,属热带北缘季风气候,受极地气团、热带气团
<正>如何看待进出口商品价格变动问题具体言之,进出口商品价格上扬的性质和特征是什么?是由什么原因引起的?对进出口贸易有何影响?对这些问题的认识和理解,直接影响着宏观
结合柳州民族民间文化的特点,对柳州民族民间文化资源进行分类描述,论述了构建柳州民族民间文化专题数据库的方式。
经济增长与发展是许多经济学家研究的主要问题。20世纪80年代早期,由罗马俱乐部出版了《增长的极限》一书,对世界前途充满悲观,遭到大多数经济学家反对,后来逐渐形成有关人类发展
<正>一直以来,小微企业融资难是困扰西部地区经济实现多元化发展的一大瓶颈问题。调研发现,截至2009年年末,甘肃小微企业的主要发展指标远低于全国平均水平。与相邻的陕西省