基于稀疏贝叶斯学习的个人信用评估

被引量 : 0次 | 上传用户:panfeng123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的快速发展,人们的消费和投资观念也在不断发生着变化,信用总规模和个人信用消费规模也随之不断扩大,个人信用交易已经成为市场经济条件下最重要的一种个人交易形式。在当前国内外经济震荡回升的形势下,消费尤其是个人消费对于经济的带动作用更加明显,而个人消费中很大的一部分是信贷消费。由来自中国人民银行2013年的个人消费信贷数据可以看出,其总规模在继续扩大,且自2010年开始保持年均24%的增长速度。个人消费信贷迅速发展的同时也增加了商业银行的信用风险,各商业银行一方面大力发展个人信贷业务,另一方面也在努力规避风险,兼顾收益性与安全性。在2007年引发全球金融危机的美国次级房贷危机中,忽略和低估个人信贷风险是一个重要的诱因。随着危机渐渐平息,在全球经济缓慢复苏的过程中,信贷机构、监管当局及国内外研究学者也越来越重视个人信用风险。由此可见,进行合理有效的个人信用评估,一方面可以规范并促进商业银行业务的发展,带动消费增长和经济发展;另一方面也有利于商业银行的正常运转及国家的经济安全。学术研究方面,国内外学者从定性和定量的角度对个人信用评估也进行了一系列的研究,涉及到计量学、统计学、人工智能和机器学习等多个领域,但目前为止尚未形成一种稳健、可靠、通用的个人信用评估模型及体系。而我国商业银行等信贷机构在个人信用评估的实际操作中,与国外尚有一定的差距,手段方法及技术比较落后:一方面主观因素较大;另一方面人工操作,效率较低。因此本文以个人信用评估方法为研究中心,结合国内外的研究及现实数据,试图构建一种新的个人信用评估方法即基于稀疏贝叶斯学习的个人信用评估模型(Sparse Bayesian Learning-based Credit, SBLCredit),以推动个人信用评估研究的深入,同时为商业银行提供一种可参考的信用评估方法。本文以个人信用评估方法为研究对象,引入了信号处理、模式识别和机器学习领域的热点-稀疏贝叶斯学习模型。个人信用评估实质上可以看作是一个分类问题,即将总体客户划分为好客户(不违约客户)和坏客户(违约客户),因此个人信用评估属于模式识别的研究范围。通过选取样本数据,并进行数据的预处理,最后构建了基于稀疏贝叶斯学习的个人信用评估模型,并在实证中进行了比较分析。为了实现研究目标,本文章节安排如下:第一苹为绪论。主要介绍了个人信用评估问题的研究背景、意义及本文的研究方法和逻辑结构。第二章为个人信用评估研究现状及其研究方法综述。首先进行了基本概念的阐释,介绍了国外个人信用评估的模式,总结了国内外个人信用评估方法,并将其分为统计学方法、非统计学方法及二者的比较分析和组合方法三种类型,并按照三类不同的信用评估方法梳理了国内外的研究文献。本论文中介绍了几种常用的信用评估方法,包括:判别分析法、Logistic回归分析法、K-近邻分析法、朴素贝叶斯分析法、分类树方法、决策树方法、数学规划法、神经网络法、支持向量机方法及遗传算法。从国内外研究梳理可以发现,目前个人信用评估方法的趋势是各种单一信用评估方法的比较研究和组合应用。第三章为稀疏贝叶斯学习模型的理论基础。介绍了基于稀疏贝叶斯学习个人信用评估模型的理论基础,回顾了概率统计理论中的条件概率、乘法定理、贝叶斯统计及贝叶斯估计和最大似然估计的基本概念,阐释了贝叶斯学习和稀疏表示的模型及原理,并在此基础上构建了稀疏贝叶斯学习框架,解释了如何将贝叶斯学习及稀疏表示运用在在分类问题中,证明了其理论上的可行性。第四章为个人信用评估指标体系。分析了评估体系的构建原则即:全面性、可操作性、可量化、预测性和适应性五个原则。介绍了国内外个人信用评估体系,并将其总结为个人指标、经济指标和信用指标三类,本文也选择国外的个人信用评估体系作为论文中个人信用评估体系的标准。第五章为数据预处理及基于稀疏贝叶斯学习的个人信用评估模型构建。选择来自UCI机器学习公开数据集中的德国和澳大利亚信用数据集,以及学者提供的英国真实信用数据集进行预处理。对于数据集做了缺失值填补、字符型变量赋值及数据归一化的处理,并介绍了多种不同的数据预处理方法。根据前面的工作,本文构建了一种基于稀疏贝叶斯学习理论的个人信用评估模型,并详细介绍了其步骤。在模型评估阶段,并选择Accuracy、Sensitivity和Specificity作为模型评估的标准。第六章实验结果比较。本章首先将基于稀疏贝叶斯学习的个人信用评估模型与传统的评估模型进行了分类精度对比,基于德国信用数据集,稀疏贝叶斯学习模型较Logistic回归模型、决策树模型、KNN算法、朴素贝叶斯模型、Linear SVM、Poly SVM、RBF SVM、Sigmoid SVM分类精度平均提高了0.53%、6.94%、5.90%、4.55%、0.56%、6.95%、4.01%、6.72%;基于澳大利亚信用数据集,稀疏贝叶斯学习模型较Logistic回归模型、决策树模型、KNN算法、朴素贝叶斯模型、Linear SVM、Poly SVM、RBF SVM、Sigmoid SVM分类精度平均提高了0.11%、3.40%、1.82%、5.78%、0.91%、3.90%、0.91%、0.91%;基于英国信用数据集,稀疏贝叶斯学习模型较Logistic回归模型、决策树模型、KNN算法、朴素贝叶斯模型、Linear SVM、Poly SVM、RBF SVM、SigmoidSVM分类精度平均提高了0.29%、8.88%、3.88%、12.01%、0.28%、0.28%、0.28%、0.28%。可见基于稀疏贝叶斯学习的个人信用评估模型较传统的信用评估模型的分类精度均有一定提升,且从十次实验结果来看,稀疏贝叶斯学习模型的分类精度波动性很小,因此,基于稀疏贝叶斯学习的个人信用评估模型是一种非常有效可靠的个人信用评估模型。为了研究不同参数设置对稀疏贝叶斯学习模型的影响,本文分别从三个方面进行了实证分析:(1)K-折交叉验证,分别取K=10,K=9,…,K=2,实验结果表明不同的K-折交叉验证法对基于稀疏贝叶斯学习的个人信用评估模型分类精度影响不大;(2)数据归一化方法,分别采用最小-最大数据归一化法、零-均值归一化方法、Unit Norm Normalization数据归一化法,实验结果表明,采用最小-最大数据归一化法、Unit Norm Normalization数据归一化法的模型分类精度明显高于零-均值归一化方法;(3)对于模型中待求解向量的方差我们设置了阈值以达到稀疏的效果,分别选取0.005,0.015,…,0.095为阈值,实验结果表明不同阈值的变化对模型分类精度影响不大。综合本章实证结果,SBLCredit较传统信用评估模型的分类精度均有一定程度的提升,且在稀疏贝叶斯学习模型中,通过采用不同的K一折交叉验证方法、数据归一化方法及阈值设置,实证结果都表明基于稀疏贝叶斯学习的个人信用评估模型是一种有效的个人信用评估模型。第七章为总结及展望。总结全文,并指出下一步研究的方向和重点。本文的主要贡献及创新点在于:(1)全面梳理了截至2014年3月国内外关于个人信用评估方法的文献,并按照不同的类别进行了归纳整理。(2)提出一种基于稀疏贝叶斯学习(Sparse Bayesian Learning, SBL)的个人信用评估模型(Sparse Bayesian Learning-based Credit, SBLCredit), SBLCredit模型首先添加各属性的权重先验知识,然后在该先验知识约束下求解属性权重,以此建立信用评估模型;对于一个待分类样本,先计算各权重与属性值乘积的累加和,然后将得到的值映射到正、负类。稀疏贝叶斯学习方法的主要研究领域在于信号处理和模式识别,因此研究稀疏贝叶斯学习方法并引入个人信用评估领域,创建一种新的有效的评估模型是本文最大的贡献和创新点。(3)在实证分析方面,以机器学习领域普遍使用的德国、澳大利亚和英国真实信用集为样本,避免了因样本选择问题对不同模型分类精度的影响,更加客观的将稀疏贝叶斯学习方法与传统的信用评估方法进行了分类精度的比较研究,同时比较分析了稀疏贝叶斯学习模型中不同参数设置对模型性能的影响。从多个方面和角度证明了稀疏贝叶斯学习在个人信用评估领域的可行性和有效性,这也是论文主要的研究目的,即旨在建立一种新的有效的个人信用评估模型,深化个人信用评估的研究领域。
其他文献
通过对新农村建设中农村金融所面临的金融组织体系不完善、功能缺失,农村资金流失严重、金融供给严重不足,保险市场发展滞后,农村金融生态环境欠佳,金融创新能力不足、服务功能缺
非财产性利益贿赂行为能否及是否应该被认定为贿赂犯罪一直以来都是学术所争议的问题,本文以原铁道部部长刘志军受贿、滥用职权案为视角,对非财产性利益贿赂在实然的层面上是
腐败是一种社会历史现象,它既是一个历史性问题又是一个世界性问题。随着社会的快速发展,腐败又凸显出一系列新的特征,像蔓藤一样延伸到社会各个角落,由此威胁到了社会的稳定
间接翻译是中国翻译史中的一个重要现象,普遍存在于翻译实践之中。从以西域胡语为中介语间接翻译佛经开始直至新时期,从原文直接翻译并未完全取代间接翻译,间接翻译现象仍然
从清太祖到清高宗,是清朝前期。这是一个连续不断进行改革的时期。这些改革,对于清王朝从最初的兴起到稳固在全国的统治起了十分重要的积极作用:1.完成了女真民族到满族共同体的
2014年1月财政部颁布了《企业会计准则39号——公允价值计量》(以下简称39号准则),使我国的企业会计准则标准体系得到了进一步的完善和扩充。早在2011年5月,美欧两大会计准则
<正>20世纪90年代以来,中国的美术馆建设随着中国城市化进程的加剧而形成高潮,众多名家纪念馆、名家艺术馆应运而生。这些名家馆多在艺术家的家乡或长期居住地修建,譬如,北京
改革开放以来,我国经济高速发展,在第十个五年计划报告中,我国制定了“走出去”的新战略,鼓励国内国有企业、民间资本到国外寻找投资项目,积极参与到经济全球化的进程中。进
做学问的人应当遵循道德规范。近年来韩国接二连三地发生各类违反学术伦理的研究行为,韩国政府和学术界由此开始致力于学术伦理的建设,通过规范学术伦理准则、重建学术伦理促
本文在介绍地理信息系统的概念、产生及发展的基础上,结合土地利用规划的主要内容,分析了地理信息系统在土地利用规划中的具体应用。旨在使更多的人们关注地理信息系统的研究