论文部分内容阅读
摘要:本文通过收集的样本客户信用报告资料拟合了Logistic模型,并设计了客户基本分计算方法、客户平时信用表现计分标准、客户最终得分计算方法、客户信用等级评判标准等。本文设计的个人信用评分体系既利用了客户基本信息判断其成为好客户的概率(向前预测),又充分考虑了其以往信用表现(历史信息),在评价客户信用状况时做到了前期工作客观公正。
关键词:信用评分;风险控制;Logistic模型
中图分类号:F830.479
文献标识码:A
文章编号:1003-9031(2007)03-0082-04
一、问题的提出
人民银行组织商业银行建设的个人信用信息基础数据库(以下简称个人征信系统)于2006年1月正式运行。个人征信系统主要采集和保存个人在商业银行的贷款、信用卡、担保等信用信息以及相关的身份识别信息。同时,人民银行将继续完善个人征信系统,逐步采集完整的个人身份信息和社保、住房公积金、税务、教育、法院、公用事业等单位的相关信用信息。商业银行在个人贷款(信用卡)审批时一般都会取得申请人的书面授权进入个人征信系统进行个人信用报告查询。但据调查,目前我国商业银行在根据个人信用报告判断客户信用状况时往往依靠工作人员的主观判断来认定一个客户的质量。在这种状况下,一个客户也许仅仅因为一次还款不及时而被商业银行拒贷,这种过度惜贷将会造成商业银行个人信贷业务的萎缩以及引起社会公众对个人征信系统的质疑,这与人民银行建立个人征信系统的初衷是相违背的。可见,商业银行如何根据个人信用报告中的详细信息科学、准确地判断申请人的信用状况,并做出是否予以贷款且以何种利率执行或是否予以发放信用卡的信贷决策,是影响着商业银行个人信贷业务的发展及风险控制的重大问题。
而个人信用评分体系的建立是解决这一问题的有效办法。个人信用评分是银行或其他金融机构利用所获得的关于信用申请人的信息,进行风险预测的一种方法和技术。它是把数学和统计模式用于个人信贷发放决策,对个人履行各种承诺的能力和信誉程度进行全面风险评价,确定信用等级和信贷限额的一种方法。[1]个人信用评估体系可以用来以风险为基础评价客户的利润率、制定初始的和持续的借款人信用额度,并在贷款偿还、发现欺诈、预期干预和减少损失等方面发挥辅助性的作用。
本文拟在借鉴国外个人信用评分模型的基础上,根据个人征信系统提供的个人信用报告对如何建立我国个人信用评分体系进行研究,以期更好地发挥个人征信系统的价值作用,促进商业银行提高信贷资产质量,推动个人信贷业务的发展。
二、FICO信用分模型和David Durand信用计分模型的比较与借鉴
在各种关于个人信用评分技术的研究和实践中,FICO信用分模型和David Durand信用计分模型历史比较悠久且使用范围比较广。
1.FICO信用分模型
FICO信用分模型是由美国工程师BillFair和数学家EarlIsaac于1956年共同发明的评分方法。如今它是美国Fair Isaac&Company的专有产品,FICO信用分因此而得名。目前,美国著名的三大信用管理局都使用FICO评分方法,每一份评估报告上都附有FICO信用分。美国商务部也要求在半官方的抵押住房业务审查中使用FICO信用分。
FICO信用分计算的基本思想是,把借款人过去的信用历史资料与数据库中的全体借款人的信用习惯相比较,检查借款人的发展趋势是否跟经常违约、随意透支、甚至申请破产等各种陷入财务困境的借款人的发展趋势相似。其实质就是应用数学模型对个人信用报告包含的信息进行量化分析。该模型主要的评估内容是客户以往发生的信用行为,其对近期行为的衡量权重要高于对远期行为的衡量权重。[2]
2.David Durand信用计分模型
David Durand信用计分模型是美国经济研究局专家David Durand于1941年将数学和统计学模型运用在信贷评估中,以大量的信贷历史经验为依据,以定量的分析方法来评估消费信贷的风险,建立的独特的信用评分模型。
David Durand信用计分模型首先分析各种变量与消费信贷质量的关系,找出最能反映贷款质量的一组变量(如住房情况、现工作单位时间、偿债率等);然后根据各个变量与贷款质量之间的关系,为每个变量的各种情况设定一个数值(如购买/拥有住房的分值为20分,租房的分值为10分,在现单位工作8年以上的28分,3-8年的24分等);最后,所有变量的分值相加,得出消费者信用得分。如果其综合分数超过了贷款政策中制定的最低标准,则说明申请人符合贷款条件;否则,就不符合条件。[3]
3.两种评分模型的比较与借鉴
FICO信用评分模型和David Durand信用计分模型实际上都是首先选取一系列和个人信用状况相关的指标(两种方法选取的指标不尽相同),将每个指标取值进行分类,然后对指标的每一类取值赋以一定的分值,根据客户状况确定其各指标的分值,最后将客户各指标的分值进行加总求出个人信用得分。上述两种信用评分模型的主要优点是将量化管理引入到信贷审批过程中,指标的选取刻画了客户的信用、品德以及支付能力,评分标准和方法简单直观,这些都值得我们借鉴。
三、基于Logistic模型的个人信用评分体系
设计FICO信用评分模型和David Durand信用计分模型的目的是为了尽量在判断客户质量时避免主观色彩,但是由于两种模型中各项指标的分值都是人为规定,故难免在评估过程中包含过多的主观意志,所以都很难达到满意的效果,需要通过更科学、更客观的技术进行数据处理才能更准确地发现隐藏在数据里的规律,以作出准确的判断。出于上述考虑,本文建立了基于Logistic模型 的个人信用评分体系,在借鉴FICO信用评分模型和David Durand信用计分模型的评分指标基础上,结合个人信用报告中的信息设计了个人信用评分指标体系,并运用Logistic模型进行定量分析,建立起相对客观的个人信用评分体系,以减少在信贷审批时的主观成分所占比重,从而更为准确地判断客户情况,为推动个人信贷业务服务。[4][5]基于Logistic模型的个人信用评分体系的建立过程如下:
1.样本采集与变量选取
我们从个人征信系统中随机选择了521份个人信用报告作为样本,其中362个为从未违约的客户(好客户),159个为曾经严重违约记录的客户(坏客户)。
在利用样本估计Logistic模型之前,首先从个人信用报告中选择与客户信用状况相关的个人基本信息进入模型作为自变量,客户质量作为因变量。个人基本信息中性别、年龄、学历、婚姻状况、住房、职务、职称、年收入、最近一次工作年限、是否为他人提供担保、是否有特别记录等11个变量与个人信用状况紧密相关,所以将这11个变量作为自变量选择进入模型。
由于11个变量都是分类变量,在建立模型时必须将它们用虚拟变量来表示。为了避免“虚拟变量陷阱”,每一个变量对应的虚拟变量数均比其分类数少1个。因此共设计了30个虚拟变量,具体情况如下:
从模型总体拟合效果看,NagelkerkeR2为0.278 ,和同类拟合模型相比拟合效果较好。另外,采用0.5为概率界限,利用拟合的Logistic模型对样本进行分类,总的准确率为74.6%,其中将好客户判断为好客户的准确率为83.3%,将坏客户判断为坏客户的准确率为55.1%,模型的拟合效果较为理想。由于目前个人信用报告中的信息尚不完整,所以将坏客户判断为坏客户的准确率还不是很高,相信随着客户资料的完善这一准确率会得到很大的提升。
以上的模型是根据样本基本信息估计的,在判断一个客户质量好坏时除了要考虑他的基本情况,同时还需要考虑其以往的信用表现,这就需要在估计模型的基础上进一步加入以往信用表现成分。
3.剔除样本中判断失误的样品,并利用守约概率计算样本客户的基本分
根据上一步样本客户实际情况与利用拟合模型判断的情况相比较的结果剔除模型判断失误的样品,利用剩余的388个判断正确的样品守约概率计算客户基本分。我们选择以50分作为起评分,将客户的守约概率乘以起评分即得出该客户的基本分。比如说一个客户的守约概率为85%,0.85×50=42.5分,该客户的基本分为42.5分。
4.结合样本客户平时信用表现计算其最终信用得分
在基本分的基础上,利用客户信用卡数、信用卡违约情况、贷款账户数、贷款账户违约记录信息计算其最终信用得分。我们认为客户信用卡的开立或贷款的发放至少证明银行对其信用状况的信任,所以客户有一张信用卡或者贷款记录就应给予其一定的得分,但是也应充分考虑顾客在开立信用卡或者发放贷款后是否有违约记录,如果违约记录超过三次就彻底抵消了银行对其的信任。出于上述考虑我们设计了如下的计算方法:以基本分为基础,客户有一张信用卡加3分,信用卡在12个月内累计未还款1次减1分,2次即减2分,依此递减;客户有一笔贷款记录加3分,贷款累计逾期1次减1分,2次减2分,依此递减。比如上面提到的基本分为42.5分的客户,他有3张信用卡,12个月内累计未还款次数合计为6,有2笔贷款,累计逾期次数合计为4,该客户的最后得分为47.5分,计算公式为:42.5+3×3-1×6+3×2-1×4=47.5分。
5.根据样本客户的最终信用得分进行聚类分析
通过以上两步的计算我们得出了样本客户的最终信用得分,最终信用得分的区间为-148.4884.63。坏客户的最终信用得分全部在23分以下。利用样本信用得分数据运用spss11.0软件进行聚类分析。
6.根据聚类分析结果和企业信用评级标准设定个人信用等级评判标准
根据聚类分析结果,参考企业信用评级的标准我们设计了客户信用等级。我们将客户的信用等级分为三等九级。具体评判标准见表1。
表1个人信用等级评判标准
比如上述客户最终信用得分为47.5分,我们判断其为BBB级,违约风险一般。
四、基于Logistic模型的个人信用评分体系的应用
建立个人信用评分体系的目的是将定量分析和定性分析相结合,为商业银行在信贷审批时提供决策支持。商业银行在接受客户贷款(信用卡)申请后经授权查询得到客户信用报告,之后将客户相关基本信息代入拟合的Logistic模型计算其守约概率,利用概率计算其基本分,在基本分的基础上计算其最终信用得分,通过其最终信用得分判断其信用等级,最后结合经验判断决定是否对其授信(具体步骤如图1所示)。
图1个人信用评分步骤
五、结语
基于Logistic模型的个人信用评分体系的主要创新在于它既利用了客户基本信息判断其成为好客户的概率(向前预测),又充分考虑了其以往信用表现(历史信息),在评价客户信用状况时做到了前期工作客观公正。但实际工作中出现的情况是多种多样的,并不是仅仅依靠模型和计算就能够解决问题的,要将定量分析和定性分析相结合才是解决之道。比如说,当我们得到一个客户的信用评分为15分时,首先判断其为B级客户,有违约风险,进一步我们就要考虑他为什么会有违约风险,他以往的违约记录是否非主观意愿造成的;该违约记录是何时发生的,之后记录有无好转趋势等。以上仅是举一个例子,实际工作中还要考虑更多的因素。
目前个人信用报告中的个人信息由于种种原因其真实性和准确性尚需进一步完善,因此我们建立的Logistic模型准确度还不是很高。相信,随着个人征信系统的逐步发展完善,个人信息所含内容及其准确性会得到大幅度的提高,会有更多个人信息进入模型,拟合的模型的准确性也会随之提高。
参考文献:
[1][2][3] 国家发展和改革委员会经济研究所信用研究中心中国信用体系建设课题组.信用知识干部读本[M].北京:中共中央党校出版社,2003.
[4] 石庆炎,靳云汇.多种个人信用评分模型在中国应用的比较研究[J].统计研究,2004,(6).
[5] 杨力,宋利,侯峰.信用评分的统计模型方法述评[J].知识丛林,2006,(7)
“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”
关键词:信用评分;风险控制;Logistic模型
中图分类号:F830.479
文献标识码:A
文章编号:1003-9031(2007)03-0082-04
一、问题的提出
人民银行组织商业银行建设的个人信用信息基础数据库(以下简称个人征信系统)于2006年1月正式运行。个人征信系统主要采集和保存个人在商业银行的贷款、信用卡、担保等信用信息以及相关的身份识别信息。同时,人民银行将继续完善个人征信系统,逐步采集完整的个人身份信息和社保、住房公积金、税务、教育、法院、公用事业等单位的相关信用信息。商业银行在个人贷款(信用卡)审批时一般都会取得申请人的书面授权进入个人征信系统进行个人信用报告查询。但据调查,目前我国商业银行在根据个人信用报告判断客户信用状况时往往依靠工作人员的主观判断来认定一个客户的质量。在这种状况下,一个客户也许仅仅因为一次还款不及时而被商业银行拒贷,这种过度惜贷将会造成商业银行个人信贷业务的萎缩以及引起社会公众对个人征信系统的质疑,这与人民银行建立个人征信系统的初衷是相违背的。可见,商业银行如何根据个人信用报告中的详细信息科学、准确地判断申请人的信用状况,并做出是否予以贷款且以何种利率执行或是否予以发放信用卡的信贷决策,是影响着商业银行个人信贷业务的发展及风险控制的重大问题。
而个人信用评分体系的建立是解决这一问题的有效办法。个人信用评分是银行或其他金融机构利用所获得的关于信用申请人的信息,进行风险预测的一种方法和技术。它是把数学和统计模式用于个人信贷发放决策,对个人履行各种承诺的能力和信誉程度进行全面风险评价,确定信用等级和信贷限额的一种方法。[1]个人信用评估体系可以用来以风险为基础评价客户的利润率、制定初始的和持续的借款人信用额度,并在贷款偿还、发现欺诈、预期干预和减少损失等方面发挥辅助性的作用。
本文拟在借鉴国外个人信用评分模型的基础上,根据个人征信系统提供的个人信用报告对如何建立我国个人信用评分体系进行研究,以期更好地发挥个人征信系统的价值作用,促进商业银行提高信贷资产质量,推动个人信贷业务的发展。
二、FICO信用分模型和David Durand信用计分模型的比较与借鉴
在各种关于个人信用评分技术的研究和实践中,FICO信用分模型和David Durand信用计分模型历史比较悠久且使用范围比较广。
1.FICO信用分模型
FICO信用分模型是由美国工程师BillFair和数学家EarlIsaac于1956年共同发明的评分方法。如今它是美国Fair Isaac&Company的专有产品,FICO信用分因此而得名。目前,美国著名的三大信用管理局都使用FICO评分方法,每一份评估报告上都附有FICO信用分。美国商务部也要求在半官方的抵押住房业务审查中使用FICO信用分。
FICO信用分计算的基本思想是,把借款人过去的信用历史资料与数据库中的全体借款人的信用习惯相比较,检查借款人的发展趋势是否跟经常违约、随意透支、甚至申请破产等各种陷入财务困境的借款人的发展趋势相似。其实质就是应用数学模型对个人信用报告包含的信息进行量化分析。该模型主要的评估内容是客户以往发生的信用行为,其对近期行为的衡量权重要高于对远期行为的衡量权重。[2]
2.David Durand信用计分模型
David Durand信用计分模型是美国经济研究局专家David Durand于1941年将数学和统计学模型运用在信贷评估中,以大量的信贷历史经验为依据,以定量的分析方法来评估消费信贷的风险,建立的独特的信用评分模型。
David Durand信用计分模型首先分析各种变量与消费信贷质量的关系,找出最能反映贷款质量的一组变量(如住房情况、现工作单位时间、偿债率等);然后根据各个变量与贷款质量之间的关系,为每个变量的各种情况设定一个数值(如购买/拥有住房的分值为20分,租房的分值为10分,在现单位工作8年以上的28分,3-8年的24分等);最后,所有变量的分值相加,得出消费者信用得分。如果其综合分数超过了贷款政策中制定的最低标准,则说明申请人符合贷款条件;否则,就不符合条件。[3]
3.两种评分模型的比较与借鉴
FICO信用评分模型和David Durand信用计分模型实际上都是首先选取一系列和个人信用状况相关的指标(两种方法选取的指标不尽相同),将每个指标取值进行分类,然后对指标的每一类取值赋以一定的分值,根据客户状况确定其各指标的分值,最后将客户各指标的分值进行加总求出个人信用得分。上述两种信用评分模型的主要优点是将量化管理引入到信贷审批过程中,指标的选取刻画了客户的信用、品德以及支付能力,评分标准和方法简单直观,这些都值得我们借鉴。
三、基于Logistic模型的个人信用评分体系
设计FICO信用评分模型和David Durand信用计分模型的目的是为了尽量在判断客户质量时避免主观色彩,但是由于两种模型中各项指标的分值都是人为规定,故难免在评估过程中包含过多的主观意志,所以都很难达到满意的效果,需要通过更科学、更客观的技术进行数据处理才能更准确地发现隐藏在数据里的规律,以作出准确的判断。出于上述考虑,本文建立了基于Logistic模型 的个人信用评分体系,在借鉴FICO信用评分模型和David Durand信用计分模型的评分指标基础上,结合个人信用报告中的信息设计了个人信用评分指标体系,并运用Logistic模型进行定量分析,建立起相对客观的个人信用评分体系,以减少在信贷审批时的主观成分所占比重,从而更为准确地判断客户情况,为推动个人信贷业务服务。[4][5]基于Logistic模型的个人信用评分体系的建立过程如下:
1.样本采集与变量选取
我们从个人征信系统中随机选择了521份个人信用报告作为样本,其中362个为从未违约的客户(好客户),159个为曾经严重违约记录的客户(坏客户)。
在利用样本估计Logistic模型之前,首先从个人信用报告中选择与客户信用状况相关的个人基本信息进入模型作为自变量,客户质量作为因变量。个人基本信息中性别、年龄、学历、婚姻状况、住房、职务、职称、年收入、最近一次工作年限、是否为他人提供担保、是否有特别记录等11个变量与个人信用状况紧密相关,所以将这11个变量作为自变量选择进入模型。
由于11个变量都是分类变量,在建立模型时必须将它们用虚拟变量来表示。为了避免“虚拟变量陷阱”,每一个变量对应的虚拟变量数均比其分类数少1个。因此共设计了30个虚拟变量,具体情况如下:
从模型总体拟合效果看,NagelkerkeR2为0.278 ,和同类拟合模型相比拟合效果较好。另外,采用0.5为概率界限,利用拟合的Logistic模型对样本进行分类,总的准确率为74.6%,其中将好客户判断为好客户的准确率为83.3%,将坏客户判断为坏客户的准确率为55.1%,模型的拟合效果较为理想。由于目前个人信用报告中的信息尚不完整,所以将坏客户判断为坏客户的准确率还不是很高,相信随着客户资料的完善这一准确率会得到很大的提升。
以上的模型是根据样本基本信息估计的,在判断一个客户质量好坏时除了要考虑他的基本情况,同时还需要考虑其以往的信用表现,这就需要在估计模型的基础上进一步加入以往信用表现成分。
3.剔除样本中判断失误的样品,并利用守约概率计算样本客户的基本分
根据上一步样本客户实际情况与利用拟合模型判断的情况相比较的结果剔除模型判断失误的样品,利用剩余的388个判断正确的样品守约概率计算客户基本分。我们选择以50分作为起评分,将客户的守约概率乘以起评分即得出该客户的基本分。比如说一个客户的守约概率为85%,0.85×50=42.5分,该客户的基本分为42.5分。
4.结合样本客户平时信用表现计算其最终信用得分
在基本分的基础上,利用客户信用卡数、信用卡违约情况、贷款账户数、贷款账户违约记录信息计算其最终信用得分。我们认为客户信用卡的开立或贷款的发放至少证明银行对其信用状况的信任,所以客户有一张信用卡或者贷款记录就应给予其一定的得分,但是也应充分考虑顾客在开立信用卡或者发放贷款后是否有违约记录,如果违约记录超过三次就彻底抵消了银行对其的信任。出于上述考虑我们设计了如下的计算方法:以基本分为基础,客户有一张信用卡加3分,信用卡在12个月内累计未还款1次减1分,2次即减2分,依此递减;客户有一笔贷款记录加3分,贷款累计逾期1次减1分,2次减2分,依此递减。比如上面提到的基本分为42.5分的客户,他有3张信用卡,12个月内累计未还款次数合计为6,有2笔贷款,累计逾期次数合计为4,该客户的最后得分为47.5分,计算公式为:42.5+3×3-1×6+3×2-1×4=47.5分。
5.根据样本客户的最终信用得分进行聚类分析
通过以上两步的计算我们得出了样本客户的最终信用得分,最终信用得分的区间为-148.4884.63。坏客户的最终信用得分全部在23分以下。利用样本信用得分数据运用spss11.0软件进行聚类分析。
6.根据聚类分析结果和企业信用评级标准设定个人信用等级评判标准
根据聚类分析结果,参考企业信用评级的标准我们设计了客户信用等级。我们将客户的信用等级分为三等九级。具体评判标准见表1。
表1个人信用等级评判标准
比如上述客户最终信用得分为47.5分,我们判断其为BBB级,违约风险一般。
四、基于Logistic模型的个人信用评分体系的应用
建立个人信用评分体系的目的是将定量分析和定性分析相结合,为商业银行在信贷审批时提供决策支持。商业银行在接受客户贷款(信用卡)申请后经授权查询得到客户信用报告,之后将客户相关基本信息代入拟合的Logistic模型计算其守约概率,利用概率计算其基本分,在基本分的基础上计算其最终信用得分,通过其最终信用得分判断其信用等级,最后结合经验判断决定是否对其授信(具体步骤如图1所示)。
图1个人信用评分步骤
五、结语
基于Logistic模型的个人信用评分体系的主要创新在于它既利用了客户基本信息判断其成为好客户的概率(向前预测),又充分考虑了其以往信用表现(历史信息),在评价客户信用状况时做到了前期工作客观公正。但实际工作中出现的情况是多种多样的,并不是仅仅依靠模型和计算就能够解决问题的,要将定量分析和定性分析相结合才是解决之道。比如说,当我们得到一个客户的信用评分为15分时,首先判断其为B级客户,有违约风险,进一步我们就要考虑他为什么会有违约风险,他以往的违约记录是否非主观意愿造成的;该违约记录是何时发生的,之后记录有无好转趋势等。以上仅是举一个例子,实际工作中还要考虑更多的因素。
目前个人信用报告中的个人信息由于种种原因其真实性和准确性尚需进一步完善,因此我们建立的Logistic模型准确度还不是很高。相信,随着个人征信系统的逐步发展完善,个人信息所含内容及其准确性会得到大幅度的提高,会有更多个人信息进入模型,拟合的模型的准确性也会随之提高。
参考文献:
[1][2][3] 国家发展和改革委员会经济研究所信用研究中心中国信用体系建设课题组.信用知识干部读本[M].北京:中共中央党校出版社,2003.
[4] 石庆炎,靳云汇.多种个人信用评分模型在中国应用的比较研究[J].统计研究,2004,(6).
[5] 杨力,宋利,侯峰.信用评分的统计模型方法述评[J].知识丛林,2006,(7)
“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”