基于多层感知器神经网络的小微企业信贷风险研究

被引量 : 0次 | 上传用户:dingzanzan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:文章以多层感知器神经网络算法为基础,对某小贷公司的小微企业信贷数据库中的信贷记录进行了信贷评估,并将该结果与决策向量机、线性判别、二次判别和逻辑回归等数据挖掘方法进行了比较。分析结果表明,从总体上看,多重感知器神经网络算法优于传统的基于参数的分类方法,即多层感知器神经网络算法拥有相对较高的ROC曲线下面积和较低的预期错误分类成本。更进一步,在研究所采用的4种MLP算法中,基于BFGS Quasi-Newton训练算法的MLP表现最为出色,可以作为金融机构进行小微信贷风险评估的辅助决策模型。
  关键词:多层感知器神经网络;小微企业;信贷评估;数据挖掘;辅助决策模型
  一、 引言
  根据《全国小型微型企业发展情况报告》(2014),截至2013年末,全国各类企业总数为1,527.84万户。其中,小微企业1,169.87万户,占企业总数的76.57%。如将4,436.29万户个体工商户纳入统计范围,小微企业所占比重达到94.15%。我国的小微企业创造GDP价值占总量的60%,纳税占总量的50%,完成了65%的发明专利和80%以上的新产品开发。然而,根据《中国小微企业白皮书》显示,目前我国小微企业融资缺口高达22万亿元,超过55%小微金融信贷需求未能获得有效支持。
  如何有效地评估小微企业的信贷风险,对学界和业界都是一个挑战。根据Blanco等[7]的建议,采用自动信用评分系统能够加快信贷审批速度,降低贷前分析成本并减少人为因素对信贷审批的影响。因此,从理论上研究小微企业信用风险预警体系,调整商业银行对小微企业的风险评价模式,构建专门的小微企业信用风险预警模型,是解决小微企业融资难问题的一个重要途径。
  进入20世纪90年代,基于数据挖掘的信用风险评价方法大幅度提高了预测的精度,以人工神经网络(ANNs)为代表的非参数分析方法已广泛应用于企业财务危机预警分析。ANNs信用风险模型以其较强的逼近非线性函数的优势从众多方法脱颖而出,其对历史数据的模拟仿真和预测能力也显示了独特的优势。然而,由于ANNs自身的限制和理论上的不完善,单一利用ANNs来评估信用风险的效果往往不理想,且信用风险评估是一个综合因素作用的过程,而多层感知器(MLP)神经网络所追求的目的就是基于多因素评估结果的最优决策。为了突破传统ANNs的局限,本文引入MLP对小微企业的信用风险进行评估研究,并将结果和传统的线性判别(LDA),二次判别分析法(QDA)和逻辑回归(LR)进行比较。
  二、 文献综述
  小微企业信贷风险评估主要包括两个方面:(1)对新申请者做出判断;(2)贷后违约预测。以往,学界研发了大量的方法和模型加速信贷决策的过程。如线性判别分析和逻辑回归是两类最常用的用于构造信贷风险评估模型的线性统计工具。然而,有学者指出,在现实环境下,由于LDA所依赖的两个假设,即输入变量服从多元正态分布,违约和非违约样本的色散矩阵或方差-协方差矩阵相等通常得不到满足,因而精度欠佳。
  ANNs的出现有效地弥补了传统方法的不足。由于ANNs具备在复杂环境下利用大量不确定信息对研究群体进行分类的能力,因而近年来被广泛应用于对复杂过程的估计和预判。神经网络也称人工神经网,是近年来信用评估领域的热点方法,作为一门新兴的信息处理科学,ANNs对人脑若干基本特征进行抽象和模拟,以人的大脑工作模式为基础,研究自适应及非程序信息处理方法。ANNs的优点是对数据的分布要求不严格,也不要求详细表述自变量与因变量之间的函数关系,能有效解决非正态分布、非线性信用评估问题。但神经网络也有自身的缺点,即为了获得最优的网路而导致训练时间过长和难以辨别输入变量的相对重要性。
  在ANNs方法中,多层感知器(MLP)神经网络因其出色的性能而被应用于风险评估领域。Werbos创立的反向传播算法已被广泛应用于MLP。MPANN(Memetic pareto artificial neural networks)通过多目标进化算法和以梯度为基础的局部搜索对BP算法进行优化。
  对神经网络的改进包括改变训练的比率和测试数据库,隐藏阶段的数目和训练循环等。Khashman通过对德国数据集进行研究,通过9种学习方案对不同的训练/验证比数据进行了研究。结果发现,用400个例子做训练并用600个例子总验证的学习方案表现最佳,总准确率达83.6%。情感神经网络是一类改进的BP学习算法,它通过两个额外的情感参数——焦虑和自信对情感权重进行更新。通过将情感神经网络和传统的神经网络进行对比,Khashman发现传统的神经网络和情感神经网络都有效,但情感神经网络在速度和准确率方面更胜一筹。另一种改善MLP的方法是人工突出可塑性MLP,其在某种分类仅有少数几种可用模式或当小概率时间包含的信息对成功应用至关重要时特别有效。通过运用可塑MLP,Marcano-Cedeno等在德国数据集上获得了84.67%的准确率,在澳大利亚数据集上获得了92.75%的准确率。
  三、 实证研究
  1. 数据集。本文使用某小贷公司小微信贷数据库中的信息,数据的时间跨度从2010年至2014年。其中包含以下几类信息:
  (1)小微企业法人或实际控制人的个人信息;
  (2)小微企业经济和财务比率数据;
  (3)小微企业当前信贷数据;
  (4)宏观经济数据。
  经过初筛并剔除异常记录,共获得5 434个小微企业样本。根据某绝大多数金融机构的定义,贷款逾期超过15天即算贷款违约。其中4 766个小微企业未发生贷款违约,占比为87.85%,剩余668个小微企业都存在不同程度的贷款违约,占比为12.15%。为了对分类模型(LDA、QDA、LP、SVM和MLP)进行有效对比,本文将数据集随机分为两个不相交的子集,其中75%的样本作为训练子集,25%的样本作为测试子集。测试子集总计包含1 359个小微企业样本(13.23%的小微企业发生贷款违约,86.77%的小微企业未发生贷款违约)。每一个模型都采用10次交叉检验。采用交叉检验的优点在于信贷模型能够最大限度地包含可用数据(75%的样本)。
其他文献
摘要:农业经济有着其他经济不具备的特殊性,不能用完全用市场化的行为来对待农业经济,农业保险也有着其他领域保险不具备的特征,普惠制农业保险机制的建立和完善不能完全依赖市场。由于普惠制农业保险机制的建立需要政府介入,农业保险政府强制机制成为普惠制农业保险的一种必要和必须。普惠制农业保险政府强制机制不等于计划经济中的政府强制行为,在计划经济过程中政府直接干预农业保险的运行,而在市场经济中政府的强制机制主
古代秘书处理公文,具有一定的知情权与管理权,确保公文安全,是其重要的工作职责。古代选用秘书,往往考察其控制信息的能力与行为。严格遵循公文稽核制度,维护涉密文件安全,是秘书的
文章沿用了委托代理分析框架,在代理人二元努力设定中,假设代理人的较高努力程度并不一定转化为较高产出作为基准模型,考察委托人在不确定情况下对于代理人的激励合同设计。
期刊
摘要:文章试图在简要综述买方势力研究文献的基础上,通过对日本钢铁企业在国际炼焦煤市场买方势力的演变,探讨解决我国大宗资源商品定价权缺失问题的对策。关键词:买方势力;大宗资源商品;国际定价权在世界贸易领域,我国已经成为许多大宗资源类商品的最大买家。但是,在全球定价体系中,我国却经常处于弱势地位,令人倍感“国际贸易定价权”缺失之痛。在完全市场竞争中,商品价格由供求关系决定,供需双方都是价格的被动接受者