基于FC和VPRS的信用风险评价研究

来源 :预测 | 被引量 : 0次 | 上传用户:weiyinbo007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:企业信用风险评价是金融领域最重要的问题之一。提出一种将模糊聚类(FC)和变精度粗糙集理论(VPRS)结合进行信用风险评价的模型。首先利用模糊聚类法对样本上市公司数据进行离散化处理,然后根据变精度粗糙集理论抽取决策规则。结果表明,由该方法生成的决策规则能对样本数据进行正确的分类,并具有一定的抗干扰性。
  关键词:信用风险;模糊聚类;变精度粗糙集;决策规则
  中图分类号:F830.5 文献标识码:A 文章编号:1003-5192(2009)05-0032-06
  
  Credit Risk Evaluation Based on Fuzzy Cluster and Variable Precision Rough Set
  GUO Jun-hua1,2,LI Bang-yi1
  (1.School of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China; 2.School of Economics and Management, East China Jiaotong University, Nanchang 330013, China)
  Abstract:Credit risk evaluation is one of the most important problems in the finance field. Fuzzy cluster and variable precision rough set theory are introduced to evaluate credit risk. Fuzzy cluster is applied to discriminate sample data. Then, decision rules are extracted by variable precision rough set theory. The result indicates that sample datacan be classifiedcorrectly by the decision rules which have the character of anti-interference.
  Key words:credit risk; fuzzy cluster; variable precision rough set; decision rule
  
  1 引言
  
  信用风险评价是商业银行贷款的重要依据。世界银行对全球银行业危机的研究表明,导致银行破产的主要原因就是信用风险[1]。随着2007年我国银行业的全面放开,我国商业银行面临的竞争更加剧烈,如何科学、合理地对企业做出正确的信用风险评价,是一个值得研究的问题。传统的信用评价方法存在某些不足,必须引入新的理论,对信用评价方法加以改进。粗糙集理论作为研究不确定知识表达、学习、归纳的新型数学工具,其重要特点是不需要预先给定某些特征或属性的数量描述,而直接从给定问题的描述集合出发,在信息不确定情况下,仍可挖掘出大量对决策有帮助的知识信息[2]。粗糙集理论提供了一整套比较成熟的样本学习式决策方法。由于标准粗糙集理论在某些条件下具有一定的局限性,缺乏对复杂系统的处理机制,对于不确定性概念的边界区域,刻画过于简单,缺乏对噪音数据的适应能力。而在实际应用中,噪音是难免的,因此Ziarko提出了变精度粗糙集(Variable Precision Rough Set,简称VPRS)模型[3],增强粗糙集合模型的抗干扰能力。本文利用变精度粗糙集理论,根据2007年我国部分上市公司公布的年报数据,以部分财务指标作为基本属性,从中筛选出能反映评价指标本质关系的重要属性,从而挖掘出数据间的关系而形成信用评价决策规则。通过这些由训练数据抽取的决策规则对测试数据进行判别表明,该方法具有良好的分类判别能力。
  
  2 文献回顾
  
  在信用风险评价的文献中,主要存在三类不同的方法。第一类是统计分类方法,第二类是神经网络方法,另一类是支持向量机方法。
  2.1 统计分类方法
  早在1966年,Beaver[4]首次运用单变量判定分析法来研究公司财务危机问题,但该方法因财务比例的选取不同而观测结果相差很大,所以很快被多变量分析法所取代。1968年,Altman率先将判别分析法应用于财务危机、公司破产及违约风险的分析,建立了Z-Score模型[5],该模型只适用于短期的预测。Altman在1977年及1983年又在Z-Score模型基础上进行了改进,建立了ZETA模型[6,7],研究结果表明ZETA模型优于Z-Score模型。Martin、Ohlson、Maddala[8~10]等人分别在1980年前后将Logistic模型应用于信用风险分析,并认为Logistic模型优于Z-Score模型和ZETA模型。
  国内学者在统计分类方法应用于信用风险评价的研究上也做出了具大贡献。陈静[11] 、张玲[12]分别利用线性判别分析法对企业信用风险进行了研究。唐晓岸、孟庆福[13]、姜天、韩立岩[14]、陈晓虹、戴静[15]、宋荣威[16]等人分别运用Logit模型对企业进行了财务预警分析。研究表明,线性判别分析法和Logit模型对企业信用风险评价有一定的准确性。
  2.2 神经网络方法
  从20世纪90年代开始,国内外学者将神经网络方法应用于信用风险的评价,方法大致有多层感知器(MLP)、BP算法网络、径向基函数(RBF)网络、概率神经网络(PNN)等几种,其中用得最多的是BP算法网络。Altman、Marco和Varetto运用MLP神经网络技术对意大利公司进行财务危机预测[17]。West分别建立MLP网络结构和RBF网络对德国和澳大利亚的银行贷款企业的财务数据进行两类模式分类[18]。Jensen、Tam、Coats等人[19~21]则分别应用BP算法针对财务状况进行了评价。Yang和Marjorie利用PNN技术建立公司破产预警模型,对美国122家石油公司进行财务困境预警研究[22]。
  在国内,学者庞素琳[23~25]对神经网络的几种模型分别进行了研究。陈雄化、林成德、叶武[26]、吴德胜、梁樑[27]等研究了BP算法在信用评价中的应用。从国内已有文献来看,国内研究对BP算法及其改进模型在信用评价中的应用较多。
  2.3 支持向量机方法
  支持向量机(SVM)方法是1995年Vapnik根据统计学习理论提出的一种学习方法,研究如何根据有限学习样本进行模式识别和回归预测等,使在对未知样本的估计过程中,期望风险达到最小[28]。该方法提出后,国内外很多学者把SVM模型应用到信用评价分析。Fan和Palaniswami利用SVM对企业破产进行预测[29]。姚奕和叶中行[30]利用SVM研究银行客户信用评估系统。钟波等[31]建立了基于LS-SVM的信用评价模型。肖文兵、费奇、万虎[32]也对支持向量机的信用评价模型进行了分析。
  以上各种方法各有其优缺点。线性判别分析法最大的优点是解释性强,且简单明了,但其假定条件过于严格,如要求每组数据满足:(1)服从多元正态分布。(2)协方差矩阵相同。(3)均值向量、协方差矩阵、先验概率和误判代价已知。而现实中这几个条件难以满足。Logit模型的优点是不需要假定任何概率分布,也不要求等协方差性,但当样本点完全分离时,模型参数的最大似然估计可能不存在而导致该方法完全失效。人工神经网络是一种对数据分布无任何要求的非线性技术,它能有效解决非正态分布、非线性的信用评估问题,但其结构确定困难,且解释性差。支持向量机方法的最大优点是能有效解决小样本问题,并且无须样本数据满足正态性和齐次方差的条件,但其分类准确率和预测准确率依赖于核函数的选取,其参数的选取都是通过反复的试验,人工选择出令人满意的参数,这种方法需要人的经验做指导,并且它的选取需要付出较高的时间代价,这样限制了支持向量机的发展。目前这三种方法中哪种方法的综合效果较优还存在一些争论,考虑到粗糙集理论在数据推理方面的强大功能,本文尝试引入变精度粗糙集理论构造信用评价模型,并对我国2007年部分上市公司进行分类。
  
  3 数据选取和模型介绍
  
  3.1 指标体系说明
  企业信用风险的形成主要取决于企业财务状况,因此,企业信用评级通常将对企业信用风险的测度转化为对企业财务状况的衡量。而影响公司财务变化的主要因素包括公司的盈利能力、营运能力、偿债能力、成长能力等指标。结合已有相关文献[2~31],本文拟采取如下指标体系,见表1。
  3.2 样本数据选择
  考虑到不同行业的生产经营特点不一样,在信用评价时如果采用相同的评价方法难免有失公允,在数据选取时应尽量选取具有相同特点的行业板块。本文在沪深证券交易所2007年年报公布的按照CSRC行业分类中的所有制造业板块中随机抽取40家企业为样本,其中ST类10家,不亏损公司30家。从其中10家ST公司中随机选择5家作为训练样本,另5家作为测试样本;同理,从30家不亏损公司中随机选择15家作为训练样本,另15家作为测试样本。主要数据采自中国上市公司资讯网上市公司财务报表及《上海证券报》、《中国证券报》上刊登的上市公司相关公告。
  3.3 模型说明
  变精度粗糙集是对标准粗糙集理论的一种扩展,它通过设置阈值参数β,放松了标准粗糙集理论对近似边界的严格定义,允许概率分类。与标准粗糙集相比,当对象在变精度粗糙集中分类时,在它的正确分类中有一个置信度,这一方面完善了近似空间的概念,另一方面也有利于根据粗糙集理论从认为不相关的数据中发现相关信息。当对象按变精度粗糙集分类时,需定义一个正确分类的阈值β。Ziarko称β为分类误差,定义区域为0≤β<0.5,An等人将β定义为正确分类的比例,在这种情况下,近似范围为0.5<β≤1.0,并将此技术称为强化粗糙集。本文将β定义为0.5<β≤1。
  (1)模糊聚类法(Fuzzy Cluster,简称FC)离散化决策表
  粗糙集理论分析要求数据必须以类别的形式出现。因此,连续数据必须首先进行离散化处理,离散的结果可能会减小原始数据的精度,但将会提高它的一般性。数据离散方法一般分为专家离散与自动离散。专家离散指由某领域的专家根据他的判断或使用该领域确定的专家进行离散;自动离散方法可分为有监督离散法和无监督离散法,其中无监督离散法可视为一个简单的聚类过程,本文使用模糊聚类分析法分别对每个指标进行离散化处理。
  在实际问题中,一组事物是否属于某一类常常带有模糊性,即问题的界限不是很清晰,对该类问题,模糊聚类分析能做出“在某种程度上是”的回答,用该方法能较好地对决策表进行离散化。假定待分类的对象集合为X={X1,X2,…,Xn},集合中的每个元素具有m个特征,设Xi中的第j个特征值为xij(j=1,2,…,m),本文中对每个指标分别进行分类,故m=1。离散步骤如下:
  当β=1时,aprβp(X)、aprβp(X)与标准粗糙集模型的上近似和下近似相同,则标准粗糙集模型就变成了变精度粗糙集模型的特殊情况。对于标准粗糙集意义下的不一致规则,根据设定的阈值β,若不一致性较弱,则可以认为这种不一致性是由于数据中存在少量噪声引起的,因此仍可把这部分规则或者主要部分看作一致性规则,若不一致性较强,则可认为据此不能得到任何确定性的信息,而将每个数据对象看作一条随机规则。
  (3)变精度粗糙集的分类质量
  变精度粗糙集的分类质量为
  
  4 实证分析
  
  首先使用模糊聚类分析法分别对训练样本中的每个指标进行离散化处理,每个指标分为三类,产生的决策表如表2所示,其中“1”表示该指标“好”,“2”表示该指标“中等”,“3”表示该指标“差”,可表示为123。对于决策属性本文沿用国内文献的研究习惯,采用两类模式分类,即非ST类上市公司视为“信用好”企业,用“1”表示, ST企业视为“信用差”企业,用“2”表示,表中的D为决策属性。
  由表3所述的决策规则一表明,如果上市公司每股收益至少为中等,并且主营业务利润率至少中等,同时满足主营业务增长率至少中等,则该企业可视为“信用好”的企业;如果在每股收益、主营业务利润率及主营业务增长率之间有一个为差,则该企业视为“信用差”的企业。其中每股收益和主营业务利润率反映的是企业的赢利能力,主营业务增长率反映的是企业的发展能力,这三者分别表明了该企业的赢利能力及持续发展能力。表4所述的决策规则二表明,如果上市公司每股收益至少为中等,并且净资产收益率至少中等,同时满足净资产增长率至少中等,则该企业可视为“信用好”的企业;如果在每股收益、净资产收益率及净资产增长率之间有一个为差,则该企业视为“信用差”的企业。其中每股收益和净资产收益率反映的是企业的赢利能力,净资产增长率反映的是企业的发展能力,这三者同样表明了该企业的赢利能力及持续发展能力。这两条决策规则都反映了上市公司的赢利能力及上市公司的成长性,是企业信用评价的重要依据。
  分别用表3及表4中的决策规则对测试样本中的20家公司进行判别表明,在抽取的两类决策规则中各有一例ST公司误判为信用好的公司,误判率为5%,分类准确率为95%(见表5),这充分说明了变精度粗糙集在信用风险评价上的可行性。
  由生成的决策规则一和决策规则二对20个测试样本分析结果可知,变精度粗糙集方法能很好地识别样本企业的信用等级,证明了该方法的有效性。并且该方法具有一定的抗干扰能力,对偶然因素导致的异常数据也能较好地识别。比如某ST公司每股收益为0.13元,该指标虽然为“中等”,但由于其主营业务利润率为负并且呈下降趋势,故该公司仍然存在财务风险,从而信用风险较大,变精度粗糙集方法能够识别这种异常数据,排除干扰;另外两家ST公司虽然净资产增长率指标都为“好”,但这主要是因为这两家公司实施了资产注入或投资收益导致的,其主营并没发生很好的改观,所以其经营仍然存在较大的风险,存在一定的信用风险,则利用生成的决策规则能很好地排除这种异常数据的干扰,能够识别出这类公司的信用风险。
  
  5 结束语
  
  在当前的分类评价决策问题中,由事例导出规则是人工智能中的一个典型的方法。本文先利用模糊聚类方法对原始数据进行离散化处理,然后将变精度粗糙集理论应用于企业信用评价中,获得了一些有益的规则和知识。获取的规则能够对企业财务状况进行科学地分类评价,并且能有效地排除异常数据的干扰。这种规则数量较少、解释性较强,能够为企业信用评价提供一些指导性的决策建议。变精度粗糙集理论无需任何假定条件,避免了统计分类方法的弊端;由变精度粗糙集理论生成的决策规则解释性强,弥补了神经网络方法的不足;变精度粗糙集理论的应用也能排除支持向量机理论反复选取核函数的较大的时间代价。基于上述优点,变精度粗糙集理论在信用评价中必然具有广阔的应用前景。需要指出的是,由于本文所研究的决策表较小,所以能较容易地搜索到所有约简,并对其进行系统地分析,若决策表很大,则搜寻所有的约简是一个NP难问题,在实际应用中,只需选择其中的一个约简进行分析即可。由于β值与分类精度是逆相关的,随着β值的增大,分类精度减小,X的正域与负域将缩小,而边界将扩大,这意味着只有少数对象被分类;而随着β值的减小,分类精度增大,X的正域与负域将扩大,而边界将缩小,这意味着大多数对象被分类,但可能被误分;在实际运用中应该根据精度要求对β作合理的设置。
  
  参 考 文 献:
  [1]世界银行.新兴市场经济中的商业银行[M].北京:中国经济出版社,1997.
  [2]Pawlak Z. Rough sets theory and its applications to data analysis[J]. Cybernetics and Systems, 1998, 29: 661-668.
  [3]张文修,吴志伟,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2001.
  [4]Beaver W H. Financial Distress: a complete guide to predicting, avoiding, and dealing with bankruptcy[M]. Brain-Brum Field Inc., 1982.
  [5]Altman E I. Financial ratios,discriminant analysis and the prediction of corporate bankruptcy[J]. Journal of Finance, 1968, 9(4): 589-679.
  [6]Altman E I, Heldeman R G, Narayanan P. ZETA analysis: a new model to identify bankruptcy risk of corporations[J]. Journal of Banking and Finance, 1977, 1: 29-54.
  [7]Altman E I. Corporte financial distress[M]. New York:John Wiley & Sons, 1983.
  [8]Earky M D. Warning of bank failure: a logit regression approach[J]. Journal of Banking and Finance, 1977,1(3): 249-276.
  [9]Ohlson J. Financial rations and the probabilistic predcition of bankruptcy[J]. Journal of Accounting Research, 1980, 1: 109-130.
  [10]Maddala G S. Limited-dependent and qualitative variables in econometrics[M]. Cambridge: Cambridge University Press, 1983.
  [11]陈静.上市公司财务恶化预测的实证分析[J].会计研究,1999,(4):31-38.
  [12]张玲,张佳林.信用风险评估方法发展趋势[J].预测,2000,19(4):72-75.
  [13]唐晓岸,孟庆福.上市公司信用评价模型[J].预测,2002,21(2):39-43.
  [14]姜天,韩立岩.基于Logit模型的中国预亏上市公司财务困境预测[J].北京航空航天大学学报(社会科学版),2004,17(1):54-58.
  [15]陈晓虹,戴静.基于Logit模型的中小企业成长危机预警[J].系统工程,2007,25(1):72-77.
  [16]宋荣威.信贷风险度量的Logit模型检验[J].电子科技大学学报(社会科学版),2007,9(5):18-21.
  [17]Altman E I, Marco G, Varetto F. Corporate distress diagnosis:comparisons using linear discriminant analysis and neural netwoeks(the Italian experience)[J]. Journal of Banking and Finance, 1994, 18: 505-529.
  [18]West D. Neural network credit scoring models[J]. Computer & Operations Research, 2000, 27: 1131-1152.
  [19]Jensen H L. Using neural networks for credit scoring[J]. Managerial Finance, 1992, 18(6): 15-26.
  [20]Tam K Y, Kiang M. Predicting bank failures: a neural network approach[J]. Management Science, 1992, 38(7): 927-947.
  [21]Coats P, Pant L. Recoganizing financial disstress patterns using a neural network tool[J]. Financial Management, 1993, 22(3): 142-155.
  [22]Yang Z R, Marjorie B, Platt H D. Probabilistic neural networks in bankruptcy prediction[J]. Journal of Business Ressearch, 1999, 44: 67-74.
  [23]庞素琳,王燕鸣.多层感知器信用评价模型研究[J].中山大学学报(自然科学版),2003,42(4):118-122.
  [24]庞素琳,黎荣舟,徐建闽.BP算法在信用风险分析中的应用[J].控制理论与应用,2005,22(1):139-143.
  [25]庞素琳.概率神经网络信用评价模型及预警研究[J].系统工程理论与实践,2005,(5):43-48.
  [26]陈雄华,林成德,叶武.基于神经网络的企业信用等级评估[J].系统工程学报,2002,16(6):570-575.
  [27]吴德胜,梁樑.遗传算法优化神经网络及信用评价研究[J].中国管理科学,2004,12(1):68-74.
  [28]Vapnik V N. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1998.
  [29]Fan A, Palaniswami M. Selecting bankruptcy predictors using a support vector machine apporach[A]. Proceedings of the International Joint Conference on Neural Network[C]. USA:IEEE Computer Society Washington,DC, 2000. 354-359.
  [30]姚奕,叶中行.基于支持向量机的银行客户信用评估系统研究[J].系统仿真学报,2004,16(4):783-786.
  [31]钟波,等.基于LS-SVM的信用评价方法[J].统计研究,2005,(11):29-31.
  [32]肖文兵,费奇,万虎.基于支持向量机的信用评估模型及风险评价[J].华中科技大学学报(自然科学版),2007,35(5):23-26.
其他文献
计算流体力学(CFD)在各种与流体相关的领域内广泛应用,并取得了很好的效果.合理的气体流场才能保证均匀的温度场,这对冷藏库内货物的降温速率和贮藏质量起着至关重要的作用,
指出了随着“绿水青山就是金山银山”理念和《“十三五”森林质量精准提升工程规划》文件贯彻的落实,林业单位要面向生产实践,以市场需求为导向,重点加强林业科技推广能力的
民主管理是促进医院持续、稳定、和谐发展的重要工作,工会组织在民主管理工作中发挥着至关重要的约束与规范作用。在新的发展时期,应加强对工会的重视,发挥其在民主管理工作
全息术是展示立体影像的3D技术,在与多个学科交叉融合后,将对社会生产、生活产生颠覆性影响。文章阐述了全息术的发展历程、基本概念、原理以及特点,并从3D虚拟馆员、全息3D打印和全息存储等方面展望全息术在图书馆中的应用前景。
基于一台11130单缸柴油机改装的点燃式甲醇发动机,研究了不同氧含量对缸内直喷甲醇发动机冷启动的未燃甲醇及甲醛的排放影响,结果表明:提高氧含量能够促进缸内甲醇混合气燃烧
VR(虚拟现实)技术在新闻行业的应用是什么样的?上游新闻用实际行动给出了答案:只需短短一分钟,新闻现场的情况就能通过上游新闻APP全方位、身临其境地传送到用户眼前,用户仅
分析了干旱地区造林成活率的影响因素,找出了主要问题,并提出了相关的解决措施:包括完善林业政策,加强造林工程管理,转变政府职能,推广旱作造林等,以提高造林的成活率。
在经济高速发展大环境下,传统的营运资金管理已不能满足现阶段的需求,需要不断扩展营运资金管理的范围,企业不能仅限于内部产生的价值,应结合上游供应商和下游顾客等外部价值
依据绿色建筑评价技术标准的要求,紧密结合厦门市经济发展、资源、环境状况,对本地区的绿色建筑适宜技术进行集成,建设试验型项目,开展应用示范。以厦门市建设局建筑废土配套
教育行业应用多媒体教学过程中,探讨多媒体教学与传统教学结合后,教学方式的改变,以及教学应用多媒体后,提高教学能力的相关建议。作为一个教育工作者,要在工作当中不断完善