基于集成学习的非均衡财务数据的分类研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:ayatowing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济全球化的快速发展,市场竞争日趋激烈,给企业带来发展和机遇的同时,也带来了大量的风险和挑战。及时发现企业自身可能存在的财务风险,不仅能避免相关者的利益受损,也有利于宏观经济的稳定发展。研究人员在财务风险预测方面构建了大量相关模型,但这些方法较少考虑到财务数据非均衡的特性,使得少数类样本的识别率较低,模型的分类性能较差。鉴于此,本文使用集成学习算法对非均衡的财务数据分类进行研究,补充优化理论的同时,经实证分析后还可以得到性能更好的分类模型,解决传统模型未将财务数据作为非均衡数据处理而导致的分类不合理的问题。本文选取2014至2018年间被特别处理的124家制造业上市公司作为研究样本,没有按照传统模型中1:1的比例选择正常经营的公司,而是基于前人研究的成果使用1:3的比例选择了372家正常公司来增加原始数据集的真实性。从盈利能力、偿债能力、成长能力、营运能力、现金流量、资本结构、股权治理结构、宏观经济观测指标和影响制造业发展的重要因素中初步选出2大类8小类共28项比率指标。本文主要针对非均衡财务数据分类指标的选定和模型的构建与评估两个方面进行研究:(1)构建分类指标体系。在建立模型前,先对初始指标进行统计性检验,剔除不存在显著性差异的指标,接下来运用K-means算法和灰色关联分析法对剩余指标进行进一步选取。实验结果得出:经统计性检验选择后共得到16个有明显显著性差异的分类指标,再经后续算法聚类分析后最终选定6个分类指标纳入分类指标体系,分别是:净资产收益率、资产报酬率、流动比率、利息保障倍数、资产负债率、制造业指数。(2)构建分类模型并评估。基于构建好的财务分类指标体系,通过对模型中超参数的选择,建立基于随机森林和XGBoost算法的财务分类模型,并将所得结果与传统模型的分类效果进行比较。实验结果得出:基于XGboost算法的模型在各项指标中均表现最优,其中精度最高可达93.29%,综合评判出基于XGboost算法的模型效果最好,证明其在财务分类中具有较强的适用性,能够尽可能多地筛选出存在财务风险的公司。本文通过理论研究的总结和实验验证的结果表明,基于集成学习算法的模型能够更好地处理非均衡财务数据,能够更加精确地对财务数据进行分类,能够更高效地识别出面临财务风险的企业。
其他文献
随着社会经济的发展,人们对教育的重视程度越来越深,新课程改革以后,国家大力提倡素质教育,促进学生的全面性发展。在竞争日益激烈的现代社会,每个父母都在极力培养孩子的各
随着物联网技术的发展,可穿戴智能终端的应用也变得越来越广泛。可穿戴智能终端作为物联网的核心载体可以采集各种数据,比如人的位置信息、健康状况等。传统的信息管理方式是
地质环境主要是地球表层岩石、土、地下水共同构成的环境系统,是自然环境的本底和自然资源的赋存系统,也是人类生存的栖息场所、活动空间及生产生活所需物质来源的载体,更是
人口老龄化以及各种意外事故所致的骨折逐渐增多,需要进行坏损骨骼修复的人群比例在逐年增加。接骨板(内固定术)是目前治疗骨折(骨裂、开放性骨折、粉碎性骨折)最有效的方法之一,
高校图书馆读书会有助于国家推行的“全民阅读”,是建设书香校园的重要组成部分和核心力量。以山东政法学院图书馆创办“悦正”读书会、开展读书活动为例,详细介绍“悦正”读
随着高新技术的不断进步和新科技革命的深入发展,大力发展高新技术产业已经成为世界各国(地区)推动产业结构升级、促进社会经济发展和提升国际竞争能力的重要国家战略。国际
调节阀在很多的工业生产领域中或者过程控制进程中均有广泛的应用,例如航空航天,农业生产,建筑工程,交通运输,船舶作业等工程领域,以及制造业等。当前我国正处于中国制造2025战略的关键时期,伴随着Internet网络技术及其它相关技术等的飞速发展,电液调节阀向着低成本、高精度、智能化的发展趋势愈加明显,国内在相关领域的研究较为落后,高精度、智能化的调节阀大多需要进口且价格昂贵。而且在一些阀门控制环境比
微结构光纤传感器指用现代先进制造技术,比如微加工或者微操作的方法,在普通光纤上制作出微米级结构,或者在微纳光纤上制作的光纤传感器。微结构光纤传感器结构灵活多样,通过
非公有制经济是我国社会主义市场经济的重要组成部分,是发展社会主义市场经济的重要力量。新形势下,非公有制企业为社会和谐稳定、经济稳步增长、创造就业机会等作出积极贡献
生活在社会中的众多个体都渴望拥有良好的社会关系,得到社会支持,社会排斥作为一种消极的人际互动却破坏了个体的这一期望。研究表明,在受到社会排斥后个体会出现情绪麻木,并