论文部分内容阅读
随着经济全球化的快速发展,市场竞争日趋激烈,给企业带来发展和机遇的同时,也带来了大量的风险和挑战。及时发现企业自身可能存在的财务风险,不仅能避免相关者的利益受损,也有利于宏观经济的稳定发展。研究人员在财务风险预测方面构建了大量相关模型,但这些方法较少考虑到财务数据非均衡的特性,使得少数类样本的识别率较低,模型的分类性能较差。鉴于此,本文使用集成学习算法对非均衡的财务数据分类进行研究,补充优化理论的同时,经实证分析后还可以得到性能更好的分类模型,解决传统模型未将财务数据作为非均衡数据处理而导致的分类不合理的问题。本文选取2014至2018年间被特别处理的124家制造业上市公司作为研究样本,没有按照传统模型中1:1的比例选择正常经营的公司,而是基于前人研究的成果使用1:3的比例选择了372家正常公司来增加原始数据集的真实性。从盈利能力、偿债能力、成长能力、营运能力、现金流量、资本结构、股权治理结构、宏观经济观测指标和影响制造业发展的重要因素中初步选出2大类8小类共28项比率指标。本文主要针对非均衡财务数据分类指标的选定和模型的构建与评估两个方面进行研究:(1)构建分类指标体系。在建立模型前,先对初始指标进行统计性检验,剔除不存在显著性差异的指标,接下来运用K-means算法和灰色关联分析法对剩余指标进行进一步选取。实验结果得出:经统计性检验选择后共得到16个有明显显著性差异的分类指标,再经后续算法聚类分析后最终选定6个分类指标纳入分类指标体系,分别是:净资产收益率、资产报酬率、流动比率、利息保障倍数、资产负债率、制造业指数。(2)构建分类模型并评估。基于构建好的财务分类指标体系,通过对模型中超参数的选择,建立基于随机森林和XGBoost算法的财务分类模型,并将所得结果与传统模型的分类效果进行比较。实验结果得出:基于XGboost算法的模型在各项指标中均表现最优,其中精度最高可达93.29%,综合评判出基于XGboost算法的模型效果最好,证明其在财务分类中具有较强的适用性,能够尽可能多地筛选出存在财务风险的公司。本文通过理论研究的总结和实验验证的结果表明,基于集成学习算法的模型能够更好地处理非均衡财务数据,能够更加精确地对财务数据进行分类,能够更高效地识别出面临财务风险的企业。