论文部分内容阅读
人类社会的发展基于最基本的社会组织——企业,而公司财务则融通于企业的每个方面,是企业经营成果与真实财务状况的最直接反映,所以对于现代企业来说,对公司财务的掌控就是对于自身发展的掌控。尤其是在当下经济周期处于波谷阶段、整个市场坏境不利的情况下,企业的发展不够稳定,对于企业财务困境的预警更加必要。随着大数据时代的全面推移,数据挖掘已然被应用到各个领域,加上中国金融市场日益规范化的趋势,人工智能方法预测企业财务困境已成为当下研究的热点之一。 尽管国内外有许多的学者在财务困境预测领域提出了大量的人工智能预测方法,并且逐步形成完善的理论体系,但是大多数的研究都是基于财务困境类别平衡的角度,这显然是不符合实际要求的。基于中国资本市场的实际情况与前人的论证,本文选取基于类别非平衡的视角进行财务困境预测研究。通过对以往文献的阅读分析,本文从实证数据角度,算法角度以及评价标准角度对基本分类器SVM进行改进,并对比单一分类器SVM以及所构建模型之间横向对比,发现本文所构建的模型对类别非平衡的财务困境预测有效果。 在理论研究中,本文以学习性能较强的分类器SVM为核心算法。在数据层面,主要运用了SMOTE过采样技术,Tome Links欠采样技术,并融合过欠重抽样方法。在算法改进角度,运用了Bagging集成技术融合SVM和Adaboost集成技术融合SVM。在评价标准层面,本文采用类别非平衡分类判别常用的评价准则G值和F值指标。本文对比分析并改进的主要模型有基于数据层面的SMOTE+SVM,Tome Links+SVM,SMOTE+Tome Links+SVM;基于算法层面改进的模型Bagging+SVM,Adaboost+SVM;基于数据层面和算法层面改进的模型SMOTE+Bagging+SVM,SMOTE+Adaboost+SVM,SMOTE+Tome Links+Bagging+SVM,SMOTE+Tome Links+Adaboost+SVM。 在实证研究中,本文收集了上交所与深交所2003年至2012年间373家ST公司被ST前的第二年财务数据,并根据行业相同资产规模相近的原则以1∶3的比例配比1119家非ST公司的财务数据作为原始样本集。并对该原始数据集通过独立样本T检验、逐步判别分析和多重共线性检验等统计方法进行预处理,得到实验用初始数据集,再通过Matlab软件对本文分析的模型进行仿真建模,得到实证结果。对比分析,无论是从数据层面改进还是从算法层面改进的SVM模型判别准确率都远优于单一的SVM模型;单独结合抽样技术时,SMOTE+SVM远优于Tome Links+SVM,SMOTE过抽样技术为准确率带了极大的提高;单独结合集成方法,Adaboost+SVM远优于Bagging+SVM,说明在类别非平衡的时候即使是结合学习能力较强的分类器,Adaboost集成也有较强的效果;过欠重抽样集成多SVM集成时,SMOTE+Tome Links+Bagging+SVM优于SMOTE+Bagging+SVM、SMOTE+Adaboost+SVM、SMOTE+Tome Links+Adaboost+SVM。综合得到过欠重抽样融合Bagging技术的SVM在本文的模型中具有最优最稳定的判别效果,其判别准确率为83.15%,G值为88,F值为74。