论文部分内容阅读
金融被视为现代经济的核心,而银行业是金融业的重要组成部分。银行的风险控制能力越来越被视为其核心竞争力的一个重要组成部分,拥有完善的风险管理的银行,能够在与同业的竞争中赢得战略性优势地位。因此,风险管理被越来越多的银行重视,各种风险也成为了银行所面临的主要威胁。商业银行面临的风险问题,可分成三个最基本的方面:信贷方面的风险,比如潜在的坏账;流动性的风险,这会涉及到资产和债务的不匹配;另外还要应对操作的风险,如虚假个人消费贷款、关联企业骗贷、票据诈骗等等。列于首位的信贷风险中就包括了信用风险,商业银行的信用风险是当前以信贷业务为主的商业银行所面临的最大风险。它是指借款人不能履行合同按时足额偿还银行贷款本息而使银行资产遭受损失的可能性。随着银行业务的多样化,与贷款类似的信用业务,如贴现、透支、信用证、担保等业务所涉及的风险也成为信用风险的控制范围。对信用风险的管理是商业银行信贷工作的首要和关键环节,事关银行的生存和社会的稳定。近年来,随着我国金融体制改革步伐的加快和金融业开放程度的提高,国内银行业面临着参与国际竞争的严峻挑战。面对金融业日益全球化的新形势,如何加强我国商业银行信用风险管理工作,缩小与国外同行的差距,已成为刻不容缓的工作。针对信用风险的管理,国内外都进行了大量的研究,一直以来国内大多数银行特别是国有银行仍然是按照行政区域来设置分支机构,由总行、省市分行、地市行、区县支行、分理处以及储蓄所,繁沓的组织架构加大了信用风险的管理难度。不过,近年来国内一些银行成功引进了国外银行作为战略合作伙伴,增强了信用风险管理体系。然而,大多数的信用风险管理都采用比较原始的方法,而现在逐步地将科学的定性定量的方法运用到了信用风险管理中来,例如数据挖掘技术。数据挖掘技术的出现,使得这些激增的数据成为了分析的关键。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先所不知道的,又是潜在有用的信息和知识的过程。利用数据挖掘技术可以使银行及时、全面、准确的掌握自己客户的各种情况,并可以根据客户为银行创造的利润多少对客户进行分类,是银行掌握同业经营状况和国内、国际经济发展趋势,为银行的资源配置提供最佳方案的手段。利用数据挖掘技术,商业银行的信用风险管理逐渐从定性化走向了定量化,评价更为科学、标准,有效的防范了不良信用所产生的不良后果。从此,数据挖掘技术成为了信用风险管理的新宠。本文旨在利用数据挖掘相关知识与技术,借助数据处理软件,对真实的银行数据源进行处理分析,采用数据挖掘的分类和聚类技术发掘出对信用管理有用的信息,并使用改良的基于分类优先的AHP方法对客户进行信用评级,确定各种指标权重来帮助银行决策。本文在对商业银行个人客户信用评分的过程中,综合的运用到了数据挖掘技术中的决策树分类技术、k均值聚类技术和AHP层次分析法。并利用了数据挖掘软件WEKA对数据进行了各种分析,并利用MATLAB对论文中需要繁杂计算的部分做了处理,使得结果更加准确,同时也提高了论文的写作效率。首先,在分析了银行业所面临的风险的前提下确定了以商业银行的个人客户信用评分为研究对象。其次,对商业银行个人客户的信用评分概况进行了深入了解,在已有的研究基础之上,对评分的方法进行了一定的改进。接着,根据对数据挖掘技术的了解,将定性和定量分析相结合,将数据进行分类和聚类,采用了数据挖掘技术中的决策树分类和k均值聚类的方法综合数据的各属性表现,将数据进行初步处理,利用WEKA数据挖掘软件对数据源进行科学的分析,并利用MATLAB简化和精确化分析过程。然后,利用层次分析法将数据的属性进行权重确定,并确定各属性分值比例,建立评分表。最后,以一个真实的银行客户数据为例,利用建立好的评分模型对随机客户进行信用评分,再根据评分结果与原方法进行比较,最后得出客户的信用分数。改良后的AHP方法是在采用传统AHP方法前,利用数据挖掘的分类和聚类技术对数据源进行比较深入的处理,将数据源进行细分,也就是将客户进行细分,采用数据挖掘的分类和聚类技术,将数据源分成k个簇以后,根据各簇的情况,再具体制定各簇将采用的指标类别评分标准,适合于k个簇的k种分类归纳、指标权重,最后建立k个信用行为评分表。这样做保证了对数据源具体问题具体分析,例如某个簇A指标比B指标显得更加重要,但由这种统一的评分标准建立的判断矩阵不一定是适合所有的数据的,或许另一个簇中根据各种情况综合分析后B指标比A指标的重要性更加显著的话,这样建立的信用评分表就不能准确的反映现实社会,只是理论上的简单实现而已。而对具体的簇进行具体的分析,虽然工作量加大,计算过程更加复杂,但是最终的结果可以跟实际的状况更加吻合,使得理论与实际联系更加紧密。银行客户的原始数据是没有任何评价和分类的,本文采用的数据源是德意志银行的客户信息,笔者首先采用决策树C4.5算法对数据源进行分类,此分类旨在根据各数据项的属性来判断信用好坏,初步给出该数据源包含的若干个数据项中的信用好坏,对于坏的信用评价这里不再细分,对于信用评价好的客户再采用聚类的k-means算法进行细分,将具有良好信用的客户再根据属性所描述的情况进行聚类,拟聚类出三个簇,然后对这三个簇进行具体的分析,对各指标进行具体的评分标准制定,建立适合于本簇的判断矩阵,再进行各自的分类归纳,最后确定指标权重,建立信用行为评分模型。总体来看,本文的创新之处主要归结于以下几点:(1)研究角度的创新,本文针对目前我国商业银行在个人客户方面的信用风险的情况,从银行的角度选择对个人客户进行信用评分作为研究对象,着重对我国商业银行怎样更有效的规避个人客户的信用风险进行了研究。(2) AHP方法的创新,本文采用将数据挖掘技术与传统的AHP层次分析法相结合的方式,对客户数据进行多层次筛选和分析。这样避免了对数据进行统一的标准确定,能让分析结果更为准确和贴近实际,能更有效的帮助银行进行更加科学合理的决策。(3)将科学的定量方法用于银行的决策系统当中,采用数据挖掘技术将客户的信用分析推向了更加科学更加准确的高度。(4)改良的AHP方法,又名分类优先AHP方法,传统的AHP方法是将所有数据纳入一个规则考虑,分类优先AHP方法则先将数据源进行归类,根据不同类的簇再依据各簇的具体情况分别确定各权重标准,例如,年龄段,超过40岁的个体和未满30岁的个体,在教育程度的权重确定上,就应该有区别,超过40岁的个体普遍教育程度比未满30岁的个体低,但是在经济承受能力上却有显著的差异,这种情况就应该分类考虑。这仅仅是一个举例,在分类和聚类的算法和理论上不会这样单一。(5)在将数据采用数据挖掘技术进行加工以后,还采用了层次分析法对影响数据的各要素进行了分析,并对数据的各个属性进行了明确评分,根据该评分可以对客户进行信用评分得出具体的分值,便于银行做出更科学化的决策。通过本文的研究,对我国商业银行的个人客户的信用风险有了进一步的认识,对风险的管理提出了定性和定量的方法,采用改进的AHP方法对个人客户的信用进行了评分,并利用WEKA,MATLAB等软件、技术和知识建立了用于评分的评分模型,对信用评分有了一个更深入的了解和清晰的框架。但需要指出的是,本文所构建的只是一个初步的简化的模型,要更精确更深入的研究个人客户的信用评分还需要进一步的深入与探讨,在实践中还有待于完善和健全。