论文部分内容阅读
【摘 要】 本文采用因子分析与Logistic回归相结合的方法构建会计舞弊识别模型。首先,对选取的9个财务指标进行因子分析,并提取出5个公因子,其次将这五个公因子纳入Logistic回归模型中进行分析,最终构建出判正率达到75%的会计舞弊识别模型。
【关键词】 会计舞弊 因子分析 Logistic回归
1. 国内外研究回顾
Loebbecke Willingham(1988)对SEC的会计审计执行公告(AAERS)进行了分析,总结出了46个舞弊风险因素。后来Bell and Carcello(2000) 进一步检验了L/M模型。Persons(1995)运用Logistic回归模型成功判定了大部分会计舞弊。Green and Choi(1997)采用人工神经网络技术构造了在原始财务数据基础上的会计舞弊判别模型。
我国对会计舞弊研究起步较晚,娄权(2003)采用描述性统计、两总体均植异方差检验和二元Logistic回归对我国上市公司财务报告舞弊的情况进行研究。陈亮、王炫(2003) 运用单因素方差分析模型构建了针对营业利润操纵的识别模型。秦江萍(2006)运用逻辑回归分析建立舞弊识别模型。
由于我国证券市场建立的时间较短,相关数据库不够完善,缺乏与真实舞弊案例相关的数据库,我国通过对异常的财务指标进行分析来识别上市公司会计舞弊行为还比较落后。
2. 研究方法与研究设计
2.1研究方法
本文主要采用的研究方法是因子分析和Logistic回归相结合的分析方法。
2.1.1因子分析
因子分析是一种降维的方法。因子模型的表达式为:xi=ui+aiF1+ai2F2+…+aimFm+εi,在该模型中 Fm叫做公因子,它们是各个观测变量所共有的因子。εi称为特殊因子,表示该变量不能被公因子所解释的部分。αim称为因子负载,可以看作是Fm在Xi中的权数。
2.1.2 Logistic回归
Logistic回归适用于因变量为二值的情况,用途在于来估计各种自变量组合条件下因变量各类别的发生概率。 以logit(ρ)为因变量,建立回归方程:logit(ρ)=ln(ρ/(1-ρ))=α+β1M1+…βiMi,其中,M表示自变量,β为与M对应回归系数,α表示模型截距, α和β都是待估计的参数,ρ为事件发生概率。 在计算出待估计的参数后,将上式转化算出ρ。
2.2研究设计
2.2.1样本选择
本文选取2009~2011年被证监会网站公开查处的30家会计舞弊的上市公司为研究样本,笔者剔除了非财务报表舞弊的违规公司,只选择违规事件涉及年报的公司。本文选取了与舞弊样本配对的30个控制样本,其选择标准为:①行业分类代码相同;②与舞弊年度样本相同年度;③剔除ST公司;④剔除曾经因财务报表舞弊问题受处罚公司;⑤剔除关键数据缺失公司。数据来源于中国证监会网站、凤凰网。
2.2.2变量定义
本文选取8个财务指标和一个非财务指标作为研究自变量。9个自变量为:X1 销售毛利率;X2 总资产利润率;X3固定资产周转率;X4总资产周转率;X5流动比率;X6速动比率;X7净利润增长率;X8利润总额增长率;X9流通股比例。因变量为Y,表示上市公司是否会计舞弊,舞弊为1,否则为0。
3. 实证检验与分析
3.1因子分析
本文首先采用因子分析,借助SPSS11.5软件对自变量X1至X9进行数据分析。分析结果为:KMO值为0.549,Bartlett球體检验值χ2统计量的显著性概率为0.000,说明数据具有相关性,是适合做因子分析的。本文提取前5个因子,它们所解释的方差占总方差的89.784%。
如上表,公因子FAC1中,X5流动比率,X6速动比率,具有较大的载荷,因此可以将第一个因子命名为偿债能力因子。在公因子FAC2中,X3固定资产周转率,X4总资产周转率具有较大的载荷,因此可以将第二个因子命名为经营能力因子。同理,将FAC3命名为获利能力因子。将FAC4命名为发展能力因子。将FAC5命名为流通股比例。再根据因子得分表可以计算出各因子的因子表达式,进一步可算出因子值。
3.2 Logistic回归检验及会计舞弊识别模型的构建
将因子分析得到的五个变量纳入模型中进行Logistic回归分析。运用SPSS11.5软件,选择Backward:Wald方式,将不符合条件的变量剔除出模型。
最终得到模型的卡方值为15.699,显著性水平为0.008,说明模型包含的自变量整体检验非常显著。另外,-2倍的似然对数值为67.479,R2为0.230,Nagelkerke R2为0.307,说明方程的拟合度一般。
如下表,以概率值0.5作为舞弊公司和非舞弊公司的分界点,得出的预测值与实际数据的比较表。可以看出30家舞弊公司中有9家被误判为非舞弊公司;30家非舞弊公司中有6家被误判为舞弊公司。总的正确判断率为75%,总体来说正确率还可以。
在最终模型中各变量的相关统计量中,从显著性水平来看, 五个公因子的显著性在95%的水平上小于0.05,说明这五个公因子对因变量(是否舞弊)有显著影响。因此可以得出会计舞弊的识别模型为:
Logit(ρ)=-0.766+0.032FAC1+0.067FAC2
+0.635FAC3+0.035FAC4+0.008FAC5,
记Z=Logit(ρ),则: ρ =ez/(1+ez) ,即利用这五个公因子就可以计算出上市公司发生会计舞弊的概率。
4. 研究结论
实证结果表明,采用因子分析和Logistic回归模型相结合建立的会计舞弊识别模型具有一定的预测效果,预测正确率达到75%,并得出流通股比例与舞弊成正比,也就是流通股所占比例越大,该公司舞弊的可能性就越大。
参考文献:
[1] 连竑彬.中国上市公司财务报表舞弊现状分析及甄别模型研究[D].厦门大学.
[2] 娄权.我国上市公司财务报告舞弊行为之经验研究[J].证券市场导报,2003,(10):8-12.
(作者单位:内蒙古财经学院研究生院会计系)
【关键词】 会计舞弊 因子分析 Logistic回归
1. 国内外研究回顾
Loebbecke Willingham(1988)对SEC的会计审计执行公告(AAERS)进行了分析,总结出了46个舞弊风险因素。后来Bell and Carcello(2000) 进一步检验了L/M模型。Persons(1995)运用Logistic回归模型成功判定了大部分会计舞弊。Green and Choi(1997)采用人工神经网络技术构造了在原始财务数据基础上的会计舞弊判别模型。
我国对会计舞弊研究起步较晚,娄权(2003)采用描述性统计、两总体均植异方差检验和二元Logistic回归对我国上市公司财务报告舞弊的情况进行研究。陈亮、王炫(2003) 运用单因素方差分析模型构建了针对营业利润操纵的识别模型。秦江萍(2006)运用逻辑回归分析建立舞弊识别模型。
由于我国证券市场建立的时间较短,相关数据库不够完善,缺乏与真实舞弊案例相关的数据库,我国通过对异常的财务指标进行分析来识别上市公司会计舞弊行为还比较落后。
2. 研究方法与研究设计
2.1研究方法
本文主要采用的研究方法是因子分析和Logistic回归相结合的分析方法。
2.1.1因子分析
因子分析是一种降维的方法。因子模型的表达式为:xi=ui+aiF1+ai2F2+…+aimFm+εi,在该模型中 Fm叫做公因子,它们是各个观测变量所共有的因子。εi称为特殊因子,表示该变量不能被公因子所解释的部分。αim称为因子负载,可以看作是Fm在Xi中的权数。
2.1.2 Logistic回归
Logistic回归适用于因变量为二值的情况,用途在于来估计各种自变量组合条件下因变量各类别的发生概率。 以logit(ρ)为因变量,建立回归方程:logit(ρ)=ln(ρ/(1-ρ))=α+β1M1+…βiMi,其中,M表示自变量,β为与M对应回归系数,α表示模型截距, α和β都是待估计的参数,ρ为事件发生概率。 在计算出待估计的参数后,将上式转化算出ρ。
2.2研究设计
2.2.1样本选择
本文选取2009~2011年被证监会网站公开查处的30家会计舞弊的上市公司为研究样本,笔者剔除了非财务报表舞弊的违规公司,只选择违规事件涉及年报的公司。本文选取了与舞弊样本配对的30个控制样本,其选择标准为:①行业分类代码相同;②与舞弊年度样本相同年度;③剔除ST公司;④剔除曾经因财务报表舞弊问题受处罚公司;⑤剔除关键数据缺失公司。数据来源于中国证监会网站、凤凰网。
2.2.2变量定义
本文选取8个财务指标和一个非财务指标作为研究自变量。9个自变量为:X1 销售毛利率;X2 总资产利润率;X3固定资产周转率;X4总资产周转率;X5流动比率;X6速动比率;X7净利润增长率;X8利润总额增长率;X9流通股比例。因变量为Y,表示上市公司是否会计舞弊,舞弊为1,否则为0。
3. 实证检验与分析
3.1因子分析
本文首先采用因子分析,借助SPSS11.5软件对自变量X1至X9进行数据分析。分析结果为:KMO值为0.549,Bartlett球體检验值χ2统计量的显著性概率为0.000,说明数据具有相关性,是适合做因子分析的。本文提取前5个因子,它们所解释的方差占总方差的89.784%。
如上表,公因子FAC1中,X5流动比率,X6速动比率,具有较大的载荷,因此可以将第一个因子命名为偿债能力因子。在公因子FAC2中,X3固定资产周转率,X4总资产周转率具有较大的载荷,因此可以将第二个因子命名为经营能力因子。同理,将FAC3命名为获利能力因子。将FAC4命名为发展能力因子。将FAC5命名为流通股比例。再根据因子得分表可以计算出各因子的因子表达式,进一步可算出因子值。
3.2 Logistic回归检验及会计舞弊识别模型的构建
将因子分析得到的五个变量纳入模型中进行Logistic回归分析。运用SPSS11.5软件,选择Backward:Wald方式,将不符合条件的变量剔除出模型。
最终得到模型的卡方值为15.699,显著性水平为0.008,说明模型包含的自变量整体检验非常显著。另外,-2倍的似然对数值为67.479,R2为0.230,Nagelkerke R2为0.307,说明方程的拟合度一般。
如下表,以概率值0.5作为舞弊公司和非舞弊公司的分界点,得出的预测值与实际数据的比较表。可以看出30家舞弊公司中有9家被误判为非舞弊公司;30家非舞弊公司中有6家被误判为舞弊公司。总的正确判断率为75%,总体来说正确率还可以。
在最终模型中各变量的相关统计量中,从显著性水平来看, 五个公因子的显著性在95%的水平上小于0.05,说明这五个公因子对因变量(是否舞弊)有显著影响。因此可以得出会计舞弊的识别模型为:
Logit(ρ)=-0.766+0.032FAC1+0.067FAC2
+0.635FAC3+0.035FAC4+0.008FAC5,
记Z=Logit(ρ),则: ρ =ez/(1+ez) ,即利用这五个公因子就可以计算出上市公司发生会计舞弊的概率。
4. 研究结论
实证结果表明,采用因子分析和Logistic回归模型相结合建立的会计舞弊识别模型具有一定的预测效果,预测正确率达到75%,并得出流通股比例与舞弊成正比,也就是流通股所占比例越大,该公司舞弊的可能性就越大。
参考文献:
[1] 连竑彬.中国上市公司财务报表舞弊现状分析及甄别模型研究[D].厦门大学.
[2] 娄权.我国上市公司财务报告舞弊行为之经验研究[J].证券市场导报,2003,(10):8-12.
(作者单位:内蒙古财经学院研究生院会计系)