面向财务危机预警的随机层叠森林算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ttcj_008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,金融科技在国内外迅猛发展,以金融科技为背景的技术正在全方位赋能金融体系的信息化和智能化,其在金融智能风控、量化交易、资产管理等领域都有巨大的研究空间和价值。财务风险预警是金融智能风控领域的重要研究问题,它能监控企业经营活动和财务状况的变化,帮助政府监管者、投资人或企业主等尽早发现企业的潜在风险,从而提早采取相应措施,它事关每一个企业生死存亡和市场经济的平稳发展,具有现实意义。针对国内已有的财务风险预警研究存在样本选择有偏、时间跨度较短、泛化能力不强等问题,本文结合了机器学习、概率统计、金融学、财务管理等跨领域的知识,从差异化集成以及聚类辅助分类的角度,开展财务风险预警模型的研究。首先,本文构建了财务风险预警的数据集,设计并采集了2006年至2016年近10年来15367条财务风险数据,涉及到2550家上市公司,6大类一级预警因子,96个二级预警因子。其次,提出了基于聚类以及stacking堆叠泛化的两阶段混联集成学习方法——随机层叠森林,进行财务风险预警。此模型先计算维度约束,再通过对多维连续特征的随机特征子空间的聚类来进行特征离散化,并生成高维特征。同时,考虑到原始特征以及随机生成的特征必然存在冗余性,故通过多层交叉集成学习来保证模型的泛化性,结合layer-by-layer的训练过程逐层进行特征剪枝和特征增强,动态评估AUC的变化决定堆叠的层深,从而达到更好的分类效果。最后,由于财务预警数据集属于非公开数据集,为了进一步验证模型的有效性,除了财务风险预警实验之外,本文同样选取一个相似但开源的金融风控数据集——ULB信用卡欺诈数据集,作为额外的补充实验。两个实验均以AUC以及少数类F1分数作为评价指标,从4个方面评估了随机层叠森林,对比了如Bagging、随机森林、Adaboost、DBDT、XGBoost、Lightgbm,Catboost以及Stacking等主流的集成学习算法,模型分类效果提升了1%-3%,证实了模型的有效性以及本文的研究方法在财务风险预警的适用性。
其他文献
金融市场是普通投资者进行投资活动的主要场所,但是以我国资本市场为代表的新兴资本市场由于成立时间较短、监管体系不完善等因素,其波动性较大。对股票市场进行有效预测成为
现代建筑业的发展,不仅造成天然砂石资源的消耗,还对生态环境造成严重破坏。因建筑拆除而产生的巨量的建筑垃圾,其处理不但需要大量财力,而且对环境的影响具有长期性。而再生
相对论量子信息是集相对论,量子理论,经典信息理论,量子场论等理论融为一体的新型交叉理论。该理论主要研究的问题包括以下两方面:一是研究相对论效应以及弯曲的时空如何影响
随着经济全球化的深入,传统的资本积累已无法满足企业的扩张需求,于是越来越多的企业期待于通过并购来迅速占有市场、实现规模经济、提升经营状况、进行行业整合和增强竞争力
致病杆菌属(Xenorhabdus sp.)是肠杆菌科一类与斯氏线虫属(Steinernema sp.)互利共生的革兰氏阴性细菌,能产生大量具有杀虫、抑菌、抗肿瘤等生物活性的次级代谢产物。基于对
目的:研究不同方式子宫动脉阻断术在腹腔镜下子宫肌瘤挖除术中的临床应用。资料与施1.临床资料选取60例子宫肌瘤患者,手术指征明确,强烈要求挖除子宫肌瘤而保留子宫。该60例
碳化硅(Silicon carbide,SiC)具有高强度,高硬度,高模量,低密度的特性。SiC还有良好的抗氧化性,抗腐蚀性,耐磨性,和低热膨胀系数。SiC同样可用作电磁屏蔽材料。但由于自身脆性,
染料敏化太阳能电池(DSSCs)以其相对较高的功率转换效率、成本效益和环境友好的制造工艺而成为传统硅基太阳能电池的一种很有前途的替代品。对电极是DSSCs的重要组成部分,铂(Pt)以其优越的电催化活性被认为是DSSCs最理想的对电极材料。然而,Pt因其价钱昂贵,储量稀少,限制了它的应用。因此,在不影响电化学性能的前提下,寻找具有低成本,储备丰富的替代材料,以降低整体的制造成本。本论文通过高温热解的
Al-Zn-Mg-Cu系合金作为超高强度铝合金,其最高的抗拉强度甚至可以达到超过500Mpa。由于其优异的力学性能,特别是它的高比强度、比刚度以及良好的耐磨性和可反复加工性,广泛应
细胞是生物体形态结构和生理活动的基本单元,通过对细胞的分析检测可以更深入的认识和了解许多生命过程,而细胞代谢产生的过氧化氢在细胞分析中则更是研究的热点之一。活性氧