企业信用评估中的一种样本预处理方法

来源 :商场现代化 | 被引量 : 0次 | 上传用户:liongliong512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]针对两类样本企业信用状况的重叠问题,提出一种基于投影寻踪和逆映射的样本预处理方法。该方法运用投影寻踪获得各样本点的一维投影值,通过逆映射提取一维投影值的散布特征,生成特征样本集,由此,在原高维空间中减少两类样本企业信用状况的重叠,从而有利于对两类样本企业的正确区分。
  [关键词]信用风险;企业信用评估;投影寻踪;逆映射;特征提取
  
  一、引言
  信用评估最常用的方法是“分类”方法,即根据借款人的财务、非财务状况,将其分为“正常”(按期还本付息)和“违约”两类,这样信用评估问题就转化为统计学上的某种分类问题。20世纪30年代以来,信用评估方法先后经历了比例分析、统计分析和人工智能等三个发展阶段。然而,在实际应用过程中,由于信用风险的复杂性和数据的非良性结构,各种信用评估方法的分类效果均会受到不同程度的影响,特别是,当两类样本的信用状况出现重叠时,信用评估方法的分类效果将受到较大影响。对于两类样本企业,其信用状况通常有不重叠和重叠两种分布情形,在实际中,样本企业往往出现第二种情形,此时,对企业信用风险状况容易产生误判。针对这一问题的解决思路主要有:(1)对重叠部分的样本进行二次判别。如文献运用混合整数规划法,通过两阶段的再分类过程,对重叠部分的样本企业进行二次判别,在一定程度上提高了预测精度。(2)运用特定的方法和手段对样本数据进行预处理,以减少两类样本企业信用状况的重叠,从而提高预测精度。目前,基于第二条解决思路的研究文献较为罕见。
  投影寻踪(Projection Pursuit,PP)是一种直接由样本数据驱动的探索性数据分析方法,特别适用于分析和处理非线性、非正态的高维数据,其基本思想是把高维数据投影到低维子空间上,寻找出能反映原高维数据的结构或特征的投影,以达到研究分析高维数据的目的。文献[7]证明了利用投影寻踪可以使两类样本在一维子空间上尽可能分离。文献[8]提出了将投影寻踪与支持向量机结合应用于企业信用评估的思路。但上述研究均是在一维子空间上进行分类识别,易丢失有效信息。有鉴于此,本文针对两类样本企业信用状况的重叠问题,着眼于第二条解决思路,提出一种基于投影寻踪和逆映射的样本预处理方法。该方法运用投影寻踪获得各样本点的一维投影值,通过逆映射提取一维投影值的散布特征,生成特征样本集,由此,在原高维空间中减少两类样本企业信用状况的重叠,从而有利于对两类样本企业的正确区分,可在一定程度上提高信用评估模型的预测精度。
  二、基于投影寻踪和逆映射的样本预处理方法
  对于企业信用状况的两分类问题,设有个企业组成训练样本集,其中,个样本为“正常企业”,个样本为“违约企业”,。企业信用评估指标集, 为训练样本在指标下的指标值。基于投影寻踪和逆映射的样本预处理方法具体步骤如下:
  步骤1:评估指标值的归一化处理。为消除各评估指标的量纲和统一各评估指标的变化范围和方向,须对评估指标值进行极值归一化处理。
  对于成本型指标,令
  
  (1)
  对于效益型指标,令
  
  (2)
  式中:分别为第j个评估指标的最大值和最小值。
  对于固定型指标,即指标值越接近某一固定值越好的指标,有
  
   (3)
  式中:为第j个评估指标的最佳稳定值。
  步骤2:构造投影指标函数。PP方法就是把维数据综合成以为投影方向的一维投影值:
  
   (4)
  上式中,为单位长度向量。PP方法在综合投影值时,要求投影值的散布特征应为:局部投影点尽可能密集,最好凝聚成若干个点团,而在整体上投影点团之间尽可能散开。由此,投影指标函数可构造为
  (5)
  式中,为投影值的标准差,为投影值的局部密度,即:
   (6)
  
  
   (7)
  
  其中,为的均值;R为求局部密度的窗口半径,它的选取既要使包含在窗口内的投影点的平均个数不太少,避免滑动平均偏差太大,又不能使它随着m的增大而增加太快,R一般可取值为0.1;点间距离;为单位阶跃函数,当时其函数值为0,当时其函数值为1。
  步骤3:优化投影指标函数。当样本集给定时,投影指标函数只随投影方向的变化而变化。不同的投影方向反映不同的数据结构特征,最佳投影方向就是最大可能暴露高维数据某类特征结构的投影方向。通过求解投影指标函数最大化问题可估计最佳投影方向,即
  
  (8)
  
  式(8)所设定的问题是一个以为优化变量的复杂非线性优化问题,常规优化方法较难处理。模拟生物优胜劣汰规则与群体内部染色体信息交换机制的实码加速遗传算法(Real Coded Accelerating Genetic Algorithm,RAGA)是一种通用的全局优化方法,用它来求解该问题则十分简便而有效。RAGA的具体算法参见文献[9]和[10]。
  步骤4:通过逆映射提取一维投影值的散布特征,生成特征训练样本集。把由步骤3求出的最佳投影方向代入式(4)后可得各样本点的一维投影值。由的散布特征可知,在整体上,“正常企业”样本的投影点团与“违约企业”样本的投影点团之间已尽可能分离。为在原高维空间中生成具有一维投影值 散布特征的特征训练样本集,可将投影轴上的投影点逆映射到原高维空间用原始变量表示。逆映射采用定理1来计算。
  定理1(内插、外推公式):已知投影轴上a、b两点和它们在高维空间相对应的点、,通过a、b两点直线上的任一点c在高维空间的坐标为:
   (9)
  式中,为内插、外推步长,其值等于a、c两点间的距离与a 、b两点间距离之比,内插时,,外推时,。上式的外推方向是从到c,如从到c,上式中的a、b两点要交换位置。
  根据本文的研究目的,同时,不失一般性,本文选取和作为逆映射中的两个已知点,它们在原高维空间中对应的点分别为和,则由定理1计算得出特征训练样本集。
  步骤5:生成特征测试样本。对于一个新的测试样本,首先,运用式(1)-(3)对测试样本的评估指标值进行标准化处理,特别地,当测试样本的第j个指标值在训练样本指标值区间()内时,即为归一化处理。然后,根据由训练样本集得出的最佳投影方向和式(4)计算出测试样本的一维投影值。最后,按照步骤4,通过逆映射,生成特征测试样本。
  三、结束语
  本文针对两类样本企业信用状况的重叠问题,运用投影寻踪技术,通过优化投影指标函数获得最佳投影方向,由最佳投影方向计算出各样本点的一维投影值,使两类样本在一维子空间上尽可能分离;然后,通过逆映射提取一维投影值的散布特征,生成特征样本集,由此,在原高维空间中减少两类样本企业信用状况的重叠,从而有利于对两类样本企业的正确区分,可在一定程度上提高信用评估模型的预测精度。本文提出的样本预处理方法为解决两类样本信用状况的重叠问题、提高信用评估方法的分类效果提供了新的方法和思路。
  
  
  
  
  
  
  参考文献:
  [1]丁 欣:国外信用风险评估方法的发展现状[J].湖南大学学报(社会科学版),2002,16(3):140-142
  [2]薛锋 柯孔林:基于混合整数规划法的企业信用风险评估研究[J].中国管理科学,2006,14(2):39-44
  [3]Martin D. Early warning of bank failure: a logit regression approach[J].Journal of Banking and Finance,1977,1(11):249-276
  [4]Sueyoshi T. Mixed integer programming approach of extended DEA-discriminant analysis[J].European Journal of Operational Research ,2004,152(1):45-55
  [5]Friedman J H,Turkey J W. A projection pursuit algorithm for exploratory data analysis[J].IEEE Transactions on computer,1974,23(9):881-890
  [6]Huber P J. projection pursuit (with discussions) [J].The Annals of Statistics,1985,13(2):435-475
  [7]王春峰 李汶华:商业银行信用风险评估:投影寻踪判别分析模型[J].管理工程学报,2000,14(2):43-46
  [8]赵晓翠 王来生:基于投影寻踪和支持向量机的模式识别方法[J].计算机应用研究,2007,24(2):86-88
  [9]付 强 赵小勇:投影寻踪模型原理及其应用[M].北京:科学出版社,2006.1-119
  [10]金菊良 丁 晶:水资源系统工程[M].成都:四川科学技术出版社,2002.37-179
  [11]鄢烈祥 麻德贤:过程系统寻优新方法-非线性映射主轴分析法[J].系统工程理论与实践,1999,19(9):79-84
其他文献
[摘 要] 按照康利对雇员需求理论的分析,深入了解员工的需求层次,进行管理激励会对企业产生重大的影响。本文试从我国酒店的实际出发,谈谈应如何做到对员工的管理激励。  [关键词] 需求理论 酒店 人力资源 管理激励    《巅峰:马斯洛赋予伟大公司的魔力》,细细读后发现书中的观点耐人寻味。作者康利有意识地将马斯洛的理论运用到经营管理中,并加以理论化、体系化呈现。我们都熟悉马斯洛五个层次的需求理论,而
期刊
一、前言  目前,委内瑞拉与中国双边关系良好。委内瑞拉在第55届、56届及57届联合国人权委员会上的表现均体现了对中国的亲善态度,并且积极支持中国加入WTO 。   中华人民共和国与委内瑞拉玻利瓦尔共和国于1974年6月28日正式建立外交关系。  32年以来,经过双方政府及各社会团体的共同努力,双边关系在多个领域内获得了长足发展。特别是2000至2005年间,中委确立了共同发展的战略伙伴关系,它促
期刊
[摘 要] 本文以浙江省为例,研究了生产性服务业对制造业集聚效应的影响作用。文章围绕以下关键点进行了深入探讨:在我国特有的转型经济体制下,影响集聚效应的因素有哪些,生产性服务业对制造业集聚效应的影响中充当了什么样的角色,不同的生产性服务行业所起的作用效果大小是否相同。我们通过理论分析和基于DEA模型的实证检验得出结论:在我们所选取的代表性的生产性服务业中,金融业对制造业集聚的影响较大,交通运输邮政
期刊
[摘 要]作为现代社会中除政府、企业之外的“第三部门”,民间组织致力于社会公益,直接代表公民行使权利。然而,由于其特殊的社会结构定位及特点,使得“志愿失灵”问题频发。因此,为了克服这一机制弊端,民间组织中的领导者就必须肩负起巨大的社会责任,与下属建立和谐的工作关系,带领员工及志愿者实现公益,而在此过程中,提高自身领导力,就成为积淀信任与互惠这一重要“社会资本”的有效途径。  [关键词]民间组织 领
期刊
[摘 要] 社会转型期,乡镇企业获得了巨大发展,为乡村社区作出了重要贡献。但是,乡镇企业在员工权益保障方面却存在比较严重的缺位现象,制约了乡村社区的和谐。现阶段,乡镇企业的员工权益保障水平普遍偏低,通过对山东省X镇民营经济园区的30家乡镇企业及其300个员工的实证研究,发现乡镇企业的自身条件、员工的文化素质、乡土社会的特点影响员工权益保障水平。  [关键词] 乡镇企业 员工 乡土社会    201
期刊
[摘 要] 以法经济学的方法与视角展开研究,以企业和政府各自不同的偏好为前提假设,构造出以安全和创新为替代品的无差异曲线模型。通过对政府的效用最大化,企业的利润最大化以及社会福利最大化三个方面的分析,探讨监管政策的适度性与合理性——在安全监管与创新之间寻找到一个平衡点,并通过对法律和政策的分析,谈论实现这一平衡点的可能性。  [关键词] 监管 创新 食品安全    实业企业的监管并不比金融企业少,
期刊
[摘 要] 当前企业职工福利费主要存在两个问题:与工资及其他成本费用界定不清、发放或支付不合理,尤其是垄断国企、事业单位等,导致国家的税收流失严重,《通知》的出台正是为了解决该问题,从而完善个人所得税的收入分配调节功能,更好地平衡公平与效率的关系。本文分析了《通知》具体实行过程中可能遇到的问题,并提出相关建议。  [关键词]职工福利费 个人所得税 收入分配调节    一、《通知》出台的背景  通过
期刊
[摘 要]随着我国医疗体制改革的进行,成本核算从作为企业的管理方法日渐被运用到医疗资源的管理中。经过近十年的发展实践,我国医疗资源核算的方法有了很大的突破,但其中也出现了不少问题。本文对我国医疗成本存在的问题进行了分析,并在分析的基础上对我国医疗成本核算的发展提出相关建议,以期提高医疗资源的利用率及医院的运行效率。  [关键词]成本核算 医疗资源 对策研究    成本核算的管理方法最先是运用于企业
期刊
什么样的作品才是一幅优秀的平面广告设计作品,一幅好的设计作品要包括哪些要素,良好的创意?优质的画面?这二者孰轻孰重?在创作广告作品的时候,我们经常处理不好二者之间的关系,从而出现了空洞乏味缺少美感或是色彩绚丽但内容空洞的作品。那创意与画面在教学当中又应侧重哪一方面进行那?在此之前让我们先来了解广告的定义和功能。  广告是以付费的方式,通过一定得媒介,向一定的人传达一定得信息,以期达到一定目的的有责
期刊
[摘 要]培养学生的创新能力是当今世界教育改革的主流,也是知识经济时代的主导精神。本文在分析《旅游英语》课程的特点基础之上,提出《旅游英语》课程考试方式的多元化建议。  [关键词]旅游英语 考试 多元化 情景模拟表演    一、引言  近几年,国家教育部启动了以培养适应新世纪我国现代化建设需要的具有创新精神、实践能力和创业精神的高素质人才为宗旨的高教教改工程。因此,需要改革传统的教学方法和考核方式
期刊