论文部分内容阅读
[摘要] 本文结合我国中小企业当前的实际情况,针对常用的财务危机预警模型的不足,为有效解决传统模型存在的小样本、高维数、非线性和局部极小点等问题,提出了利用SVM(支持向量机)的分类能力建立财务预警模型。最后利用上市公司的财务数据进行训练和评估,证明了基于支持向量机的财务预警模型在小样本情况下具有良好的非线性建模能力和泛化能力。
[关键词] 财务危机 预警 支持向量机
一、研究背景
中小企业在我国的国民经济中具有重要的作用。据统计资料显示,全国工商登记注册的企业中,中小企业占了99%。中小企业创造的工业产值和利润分别约占60%和40%;另外,中小企业还提供了75%的城镇就业机会,并在一定程度上影响着许多地区乃至整个国家的经济繁荣和社会稳定。然而, 据一份调查统计:80%的中小企业在开业的五年内倒闭。从财务角度来看, 有两个突出表现:一是企业盈利能力的不断下降, 直至亏损经营;二是资金短缺, 偿债能力降低。因此, 有必要通过企业财务危机预警来预测和及时发现企业经营情况和财务状况的变化。
企业财务预警,是经过对企业财务报表及相关经营数据的分析,通过设置并观察一些敏感性预警指标的变化,对企业可能或将要面临的财务危机实施的实时监控和预测警报。当前被广泛研究并应用的财务危机预警模型概括起来主要有统计模型和人工智能模型两大类。统计模型包括Z评分模型、多元判别分析模型、Logistic回归模型及主成分分析模型等,人工智能模型包括综合模糊评价模型、神经网络模型等。上述模型在应用时均须依赖大量的历史样本, 其中统计模型以数据服从多元正态分布为假设前提,综合模糊评价模型以必要的专家经验为依据,神经网络模型在目前仍缺乏统一的数学理论,在确定网络结构、提高算法的解释性、解决过学习和欠学习以及局部极小点等问题上也难以突破。本文提出了利用SVM(支持向量机)的分类能力建立财务预警模型以有效解决传统模型存在的小样本、高维数、非线性和局部极小点等问题,从而提高财务危机预警的决策效率和效果。
二、SVM(支持向量机)简介
支持向量机(supportvectormachine,SVM)方法是在统计学习理论基础上发展起来的一种新的通用学习方法。它以VC维理论和结构风险最小化原理为基础,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻找最佳折衷,以期获得最好的推广能力(即对未来输出进行正确预测的能力)。由于SVM方法特别适合有限样本的情况,理论上可获得全局最优点,能保证学习机器具有良好的推广能力,且计算复杂度与样本维数无关,近年来在模式识别、函数逼近、回归估计等方面获得了较好的应用。
SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用图1的两维情况说明。图中,实心点和空心点代表两类样本,H为分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。分类线方程为x*w+b=0,我们可以对它进行归一化,使得对线性可分的样本集(xi,yi),i =1,…,n,x∈Rd,y∈{+1,-1},满足
yi[(wTx)+b]-1≥0, i=1,…,n(1)
此时分类间隔等于2/,使间隔最大等价于使最小。满足条件(1)且使1/2最小的分类面就叫做最优分类面,H1、H2上的训练样本点就称作支持向量。
利用Lagrange优化方法可以把上述最优分类面问题转化为其对偶问题,这是一个不等式约束下二次函数寻优的问题,存在唯一解。容易证明,解中将只有一部分(通常是少部分)α1*不为零,对应的样本就是支持向量。解上述问题后得到的最优分类函数是:
(2)
其中b*为分类阈值,可以通过任何一个支持向量求得。当样本为线性不可分时,加入一个松弛变量,此时约束条件变为:
(3)
目标函数变为使目标函数最小。式中C是对分类错误的惩罚因子。
实际中的大部分问题,都是非线性问题,其数据都是非线性的。可以通过非线性映射:把向量映射到一个高维线性特征空间,然后在此高维特征空间中构造最优分类超平面一般来说这种非线性映射不易实现,此时可用满足Mercer条件的核函数来代替这种非线性变换。此时分类函数K(xi,x)最终变为:
(4)
三、基于SVM的财务危机预警模型
1.财务危机预警指标体系
科学、有效的财务危机预警指标体系是建立财务危机预警模型的基础和依据。所建财务危机预警指标体系应遵循如下原则:
(1)预见性原则
预见性原则是财务预警系统的重点,即选择的指标变化该超前于中小企业的实际财务活动及其产生的问题,这就要财务预警系统所选定的指标必须能够准确地预测企业财务状变动及其发展趋势,并以此有效界定出能使企业生产经营处稳定发展态势的合理界限。
(2)灵敏性原则
灵敏性原则是企业财务预警系统的根本目的,即选择的标能够快捷地反映出中小企业财务状况的主要方面。由于财预警的基本功能就是要敏感地反映企业财务运行状况及经济行过程中的波动,因此,遵循灵敏性原则就能通过改变财务系的控制参数和变量,及时调控企业的资源分配,使企业财务状况的异常变动状况得到收敛和控制,从而使企业财务状况的变化能够始终运行在合理的置信区间内。
(3)稳定性原则
稳定性原则是评价中小企业财务预警系统优劣的重要件,即通过相关的财务模拟操作,对所选定指标的变化幅度进行科学有效地划分,使划分的标准能够在较长时间内保持相对定性,从而更好地发挥财务预警功能。
(4)配合性原则
配合性原则是指各项预警指标能够相互协调和配合。财务预警指标系由众多相互联系、相互影响的预警指标构成,即使在中小企业中也是如此,既包括反映企业偿债能力的指标,又包括反映企业盈利能力和营运能力的指标。通过这些指标的共同监测,能从整体上强化预警企业财务总体变动状况的功能,从而提高预警信号的有效度。并且,一旦企业财务状况的波动倾向变化时这些指标的波动倾向要提前(或滞后)反应出相应变化。
在满足上述原则的前提下,从盈利能力、营运能力、短期偿债能力和长期偿债能力4个方面设置了15项指标,建立了企业财务危机预警指标体系(见表1)。
2.样本数据的选取
在预警模型建立过程中,我们假定被ST的公司存在财务危机,而非ST的公司财务状况良好。国外相关研究表明:采用破产之后获得的信息来建立预测模型会高估模型的预测能力。因此本文在选取训练样本时,采用的是上市公司被ST前两年的财务信息(即:公司2005年被ST,则选用2003年的财务信息)作为训练数据,来构建预警模型,预测上市公司是否会在下年因为出现财务困境而被特别处理。这样避免了高估模型预测能力的问题。为了凸显小样本、高维数的特性,
本文选取了22家公司的样本数据(原始数据见表2,其中所有数据均为预处理后的数据),以前20个为训练样本,将另外两个作为检验样本进行检验。
3.SVM的参数选择
根据上面的分析,构造了样本集(x,y),其中的维数为15,y是样本的属性类别,对于“ST”的公司,令y=1;对于非“ST”的公司,令y=-1。核函数的选择和惩罚系数C的选择是支持向量机需要确定的主要参数。常用的核函数有多项式核函数、径向基核函数和两层神经网络Sigmoid函数等。这三个核函数的性能相差不大,本文采用常用的径向基核函数。径向基核函数的形式为:
此时,需要选择的参数为C和σ2。参数选择可以用穷举法,但速度较慢。本文采用采用5层交叉验证方法 ,即l=5,采用“格搜索”法逐次提高(C, σ2)取值,应用 MATLAB 编程得到的不同的(C,σ2)参数对所对应的交叉验证准确率以及支持向量数。
选取(C, σ2) 等于(100,5)时,二次规划(KDP)的全局最优解为α6*=21.5434,α8*=18.0077,α13*=35.6419,α18*=3.9439,其余向量对应α*=0可见,支持向量下标集sv={(xi,yi)|i=6,8,13,18}。同时得到=79.136975,b*=0,分类间隔为0.224823,最优分类函数即财务危机预警模型为:
將另外两组检验样本代入预警模型,预测结果如下:
f(x21)=sgn(-1.5219)=-1
f(x22)=sgn(1.2514)=+1;
可见企业21财务正常,企业22出现财务危机需要预警,这与实际情况完全一致。
四、结束语
SVM是基于小样本学习的通用学习算法,具有严格的理论基础,无须大量样本和事先假设,用其进行财务危机预警能够给出简单统一的数学模型,能较好地解决传统评估方法不能解决的非线性、高维和局部极小等实际问题,可很好地实现企业财务危机的状态测定和动态预警,具有较好的发展前景。
参考文献:
[1]姜秀华任强 孙铮:上市公司财务危机预警模型研究[J].预测,2002
[2]杨淑娥徐伟刚:上市公司财务预警模型 ———Y分数模型的实证研究[J].中国软科学 ,2003(1)
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。
[关键词] 财务危机 预警 支持向量机
一、研究背景
中小企业在我国的国民经济中具有重要的作用。据统计资料显示,全国工商登记注册的企业中,中小企业占了99%。中小企业创造的工业产值和利润分别约占60%和40%;另外,中小企业还提供了75%的城镇就业机会,并在一定程度上影响着许多地区乃至整个国家的经济繁荣和社会稳定。然而, 据一份调查统计:80%的中小企业在开业的五年内倒闭。从财务角度来看, 有两个突出表现:一是企业盈利能力的不断下降, 直至亏损经营;二是资金短缺, 偿债能力降低。因此, 有必要通过企业财务危机预警来预测和及时发现企业经营情况和财务状况的变化。
企业财务预警,是经过对企业财务报表及相关经营数据的分析,通过设置并观察一些敏感性预警指标的变化,对企业可能或将要面临的财务危机实施的实时监控和预测警报。当前被广泛研究并应用的财务危机预警模型概括起来主要有统计模型和人工智能模型两大类。统计模型包括Z评分模型、多元判别分析模型、Logistic回归模型及主成分分析模型等,人工智能模型包括综合模糊评价模型、神经网络模型等。上述模型在应用时均须依赖大量的历史样本, 其中统计模型以数据服从多元正态分布为假设前提,综合模糊评价模型以必要的专家经验为依据,神经网络模型在目前仍缺乏统一的数学理论,在确定网络结构、提高算法的解释性、解决过学习和欠学习以及局部极小点等问题上也难以突破。本文提出了利用SVM(支持向量机)的分类能力建立财务预警模型以有效解决传统模型存在的小样本、高维数、非线性和局部极小点等问题,从而提高财务危机预警的决策效率和效果。
二、SVM(支持向量机)简介
支持向量机(supportvectormachine,SVM)方法是在统计学习理论基础上发展起来的一种新的通用学习方法。它以VC维理论和结构风险最小化原理为基础,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻找最佳折衷,以期获得最好的推广能力(即对未来输出进行正确预测的能力)。由于SVM方法特别适合有限样本的情况,理论上可获得全局最优点,能保证学习机器具有良好的推广能力,且计算复杂度与样本维数无关,近年来在模式识别、函数逼近、回归估计等方面获得了较好的应用。
SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用图1的两维情况说明。图中,实心点和空心点代表两类样本,H为分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。分类线方程为x*w+b=0,我们可以对它进行归一化,使得对线性可分的样本集(xi,yi),i =1,…,n,x∈Rd,y∈{+1,-1},满足
yi[(wTx)+b]-1≥0, i=1,…,n(1)
此时分类间隔等于2/,使间隔最大等价于使最小。满足条件(1)且使1/2最小的分类面就叫做最优分类面,H1、H2上的训练样本点就称作支持向量。
利用Lagrange优化方法可以把上述最优分类面问题转化为其对偶问题,这是一个不等式约束下二次函数寻优的问题,存在唯一解。容易证明,解中将只有一部分(通常是少部分)α1*不为零,对应的样本就是支持向量。解上述问题后得到的最优分类函数是:
(2)
其中b*为分类阈值,可以通过任何一个支持向量求得。当样本为线性不可分时,加入一个松弛变量,此时约束条件变为:
(3)
目标函数变为使目标函数最小。式中C是对分类错误的惩罚因子。
实际中的大部分问题,都是非线性问题,其数据都是非线性的。可以通过非线性映射:把向量映射到一个高维线性特征空间,然后在此高维特征空间中构造最优分类超平面一般来说这种非线性映射不易实现,此时可用满足Mercer条件的核函数来代替这种非线性变换。此时分类函数K(xi,x)最终变为:
(4)
三、基于SVM的财务危机预警模型
1.财务危机预警指标体系
科学、有效的财务危机预警指标体系是建立财务危机预警模型的基础和依据。所建财务危机预警指标体系应遵循如下原则:
(1)预见性原则
预见性原则是财务预警系统的重点,即选择的指标变化该超前于中小企业的实际财务活动及其产生的问题,这就要财务预警系统所选定的指标必须能够准确地预测企业财务状变动及其发展趋势,并以此有效界定出能使企业生产经营处稳定发展态势的合理界限。
(2)灵敏性原则
灵敏性原则是企业财务预警系统的根本目的,即选择的标能够快捷地反映出中小企业财务状况的主要方面。由于财预警的基本功能就是要敏感地反映企业财务运行状况及经济行过程中的波动,因此,遵循灵敏性原则就能通过改变财务系的控制参数和变量,及时调控企业的资源分配,使企业财务状况的异常变动状况得到收敛和控制,从而使企业财务状况的变化能够始终运行在合理的置信区间内。
(3)稳定性原则
稳定性原则是评价中小企业财务预警系统优劣的重要件,即通过相关的财务模拟操作,对所选定指标的变化幅度进行科学有效地划分,使划分的标准能够在较长时间内保持相对定性,从而更好地发挥财务预警功能。
(4)配合性原则
配合性原则是指各项预警指标能够相互协调和配合。财务预警指标系由众多相互联系、相互影响的预警指标构成,即使在中小企业中也是如此,既包括反映企业偿债能力的指标,又包括反映企业盈利能力和营运能力的指标。通过这些指标的共同监测,能从整体上强化预警企业财务总体变动状况的功能,从而提高预警信号的有效度。并且,一旦企业财务状况的波动倾向变化时这些指标的波动倾向要提前(或滞后)反应出相应变化。
在满足上述原则的前提下,从盈利能力、营运能力、短期偿债能力和长期偿债能力4个方面设置了15项指标,建立了企业财务危机预警指标体系(见表1)。
2.样本数据的选取
在预警模型建立过程中,我们假定被ST的公司存在财务危机,而非ST的公司财务状况良好。国外相关研究表明:采用破产之后获得的信息来建立预测模型会高估模型的预测能力。因此本文在选取训练样本时,采用的是上市公司被ST前两年的财务信息(即:公司2005年被ST,则选用2003年的财务信息)作为训练数据,来构建预警模型,预测上市公司是否会在下年因为出现财务困境而被特别处理。这样避免了高估模型预测能力的问题。为了凸显小样本、高维数的特性,
本文选取了22家公司的样本数据(原始数据见表2,其中所有数据均为预处理后的数据),以前20个为训练样本,将另外两个作为检验样本进行检验。
3.SVM的参数选择
根据上面的分析,构造了样本集(x,y),其中的维数为15,y是样本的属性类别,对于“ST”的公司,令y=1;对于非“ST”的公司,令y=-1。核函数的选择和惩罚系数C的选择是支持向量机需要确定的主要参数。常用的核函数有多项式核函数、径向基核函数和两层神经网络Sigmoid函数等。这三个核函数的性能相差不大,本文采用常用的径向基核函数。径向基核函数的形式为:
此时,需要选择的参数为C和σ2。参数选择可以用穷举法,但速度较慢。本文采用采用5层交叉验证方法 ,即l=5,采用“格搜索”法逐次提高(C, σ2)取值,应用 MATLAB 编程得到的不同的(C,σ2)参数对所对应的交叉验证准确率以及支持向量数。
选取(C, σ2) 等于(100,5)时,二次规划(KDP)的全局最优解为α6*=21.5434,α8*=18.0077,α13*=35.6419,α18*=3.9439,其余向量对应α*=0可见,支持向量下标集sv={(xi,yi)|i=6,8,13,18}。同时得到=79.136975,b*=0,分类间隔为0.224823,最优分类函数即财务危机预警模型为:
將另外两组检验样本代入预警模型,预测结果如下:
f(x21)=sgn(-1.5219)=-1
f(x22)=sgn(1.2514)=+1;
可见企业21财务正常,企业22出现财务危机需要预警,这与实际情况完全一致。
四、结束语
SVM是基于小样本学习的通用学习算法,具有严格的理论基础,无须大量样本和事先假设,用其进行财务危机预警能够给出简单统一的数学模型,能较好地解决传统评估方法不能解决的非线性、高维和局部极小等实际问题,可很好地实现企业财务危机的状态测定和动态预警,具有较好的发展前景。
参考文献:
[1]姜秀华任强 孙铮:上市公司财务危机预警模型研究[J].预测,2002
[2]杨淑娥徐伟刚:上市公司财务预警模型 ———Y分数模型的实证研究[J].中国软科学 ,2003(1)
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。