上市公司财务“爆雷”预警模型 ——基于不平衡样本的优化

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:jiaoxuepan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2019年的资本市场又是令投资者胆战心惊的一年。康美药业近300亿货币资金不翼而飞,康得新连续4年间累计虚增利润总额119.21亿元。“两康”事件令无数的投资者蒙受了巨大的损失,同时也在各市场参与者的心中敲响了警钟。财务数据作为定期向全市场公开的数据,是市场预期形成的底层架构。亦真亦假的财务数据使得资本市场更加令人畏惧。那么,作为市场参与者,如何才能规避这些财务“地雷”公司呢?本文回顾海内外有关盈余管理、财务造假的文献,发现现有的研究存在较为明显的问题。Dechow et al.(2011)提出的F-score模型是目前最为著名的财务造假预测模型,该模型曾因成功甄别本世纪初震惊全球的安然造假案而闻名。F-score模型运用Logistic回归的方法,证明了财务数据具备甄别财务“爆雷”的能力,成功从样本中甄别了69%的存在财务造假或重大错误陈述的公司。然而,由于样本的极度不平衡以及对非财务数据挖掘不足等原因,Fscore模型表现出高误报率的特征。其合计发出了4.95万次信号,才得以命中339个“地雷”样本,即0.7%的精确率。钱苹和罗玟(2015)针对中国A股市场开发的C-score模型基本延续了F-score模型的思路,因此同样存在误报率畸高的缺点。过高的误报率使得现有的模型很难参与到金融市场的实际应用。本篇文章收集了从2014年年报到2018年年报之间全部A股上市公司的财务报告,共40415份财务数据样本。并将披露后一年内,公司被出具非标审计意见的样本作为观测样本,即“地雷”样本,共1584个,剩余样本作为控制样本。“地雷”样本与控制样本的数量比例达到1:25。本文综合海内外文献、财务造假案例、各类财务分析软件、财务报表附注以及监管问询函文本等资料,从财务杠杆、盈利能力、成长性、资产周转能力、盈利质量、资产质量、异常背离、公司治理结构、公开市场信息及产业链共10个维度出发,挖掘了近140个解释变量。解释变量数量和全面性超过现有研究。针对数目繁多的解释变量,本文首先通过信噪比、方差分析、方差膨胀因子检验进行了特征变量的预筛选。其次,本文应用L1正则化的Logistic回归模型,同时通过最大化F2分数的方法进行模型判断阈值的选择,得到了一个简洁、意义明确且分类效果出色的Logistic模型。估计得的模型表明最近年报是否亏损、存贷双高、近一年监管问询函数量、客户单一程度、期间费用率、股权集中度、ROA、股息率、员工平均薪酬是甄别我国A股上市公司财务“地雷”风险的关键指标。该模型的召回率为60.86%,精确率为22.51%,虽然召回率较F-score模型和Cscore模型有些许下降,但精确度大幅提升,使该模型具备实际应用的可能。另,从F2分数上看,该模型拥有显著更强的综合性能。进一步的,本文探索了机器学习领域中的不平衡学习方法Easy Ensemble。Easy Ensemble是一种特殊的欠采样方法,通过对样本的抽样再构,改善样本不均衡带来的模型估计困难。本文分别尝试了以Logistic、Ada Boost、XGBoost和SVM作为的基学习器的Easy Ensemble模型。发现Easy Ensemble方法能大幅度的改善模型的分类性能,大幅提升对小类样本的估计准确度。其中,Easy Ensembled XGBosst拥有最强的分类性能,该模型成功从1584个“地雷”样本中成功甄别了1398个,召回率高达88.26%,同时模型的精确率也达到19.36%,F2分数高达0.5156,大幅度优于传统的Logistic回归模型。本文即提供了意义明确、便于使用的Logistic回归模型,也提供了性能强劲、召回率高、误判率低的Easy Ensembled XGBoost模型。本文给出的模型即可应用于投资过程中的风险控制,也可稍加变换用以辅助财务分析、个股选择,还可以用于协助审计师和监管机构及早发现财务粉饰或财务造假,具有充分的现实意义。
其他文献
反义复合词源远流长,其来源可追溯到先秦时期,殷代甲骨文中已经出现了反义复合词。而当前学界的已有研究多从《现代汉语词典》出发,聚焦于汉语本体层面,主要就反义复合词的形成演变、语法结构、语义特点等进行阐述,对反义复合词在对外汉语教学中的应用仍可进一步挖掘、研究。因此,本文选取《汉语水平词汇与汉字等级大纲》中的反义复合词作为研究对象,以认知语言学为指导,试图在结合汉语本体研究的基础上探求对外汉语教学中反
学位
统编小学语文教材“语文园地”作为单元练习板块,是教材的重要组成部分。但在实际教学中却存在被忽视的问题,现状不容乐观。研究将统编小学低年级语文教材“语文园地”作为研究对象,以求更好地推进语文园地板块的研究,提高教师开发、利用“语文园地”的水平。研究从统编小学低年级语文教材“语文园地”入手,在梳理文献综述的基础上,以新课标、语文核心素养、统编教材编写理念、整体性教育观为认知基础,进行教材的分析。首先是
通信网络是当今信息社会大数据承载和交互的基础,为满足海量数据大带宽承载需求,通信运营商亟需建设完善其通信网络基础设施,其中通信节点机房作为网络基础设施的重要网元节点,其建设进度直接关系着通信网络承载能力的及时形成。因此,本文以J市Y通信运营商的通信节点机房建设项目的进度管理作为研究对象,并采用理论文献资料与实际案例相结合、定性与定量分析相结合、以及对比分析和逻辑分析相结合的方法,主要基于对项目进度
对于中国学习英语的人来说,获取英语语言输入的重要方式是英语阅读的学习,也是中国学生应该把握的语言学习技巧中的其中之一。阅读策略的讲授不但对提高学生的阅读策略的意识和阅读学业成绩有促进作用,而且对学生自主学习有很大的帮助,进一步对学生们的一生学习提供了条件和机会。所以,对于老师来说,开展阅读策略的教学是十分重要的。为了能够让阅读策略的开展更有目的性,有更高的效率,对学生的阅读策略的掌握情况进行调查就
成本控制是企业管理的核心内容之一,关乎企业的可持续发展能力。工程成本管控是影响企业总成本的核心之一,直接影响企业集团的盈利能力。工程质量、工程成本及工程进度三者之间的关系具有辩证的对立统一性。在成本管理发展过往中,过于将成本控制的发力点放在施工建设过程中,较少从事前控制的设计环节入手,对成本结构进行设计,聚焦控制成本的关键环节,从而真正降低成本。基于此,本文以T火电厂汽动引风机技改项目为例,系统研
互联网众筹是互联网金融的重要组成部分,其利用众筹平台将社群力量汇集起来向投资者募集资金,用以支持个人活动、公益项目或商业组织,为小微企业融资难问题提供了新的解决思路。然而近年来随着政府相关政策颁布以及诸多互联网巨头涌入并布局众筹行业,国内众筹市场进入洗牌期,存在着譬如羊群效应广泛存在加剧融资难度、具有潜力的项目达不到目标筹资金额而宣告失败等诸多问题。据此,探究互联网众筹项目羊群效应及动态周期性研究
随着市场经济的不断发展,部分上市公司和大股东的融资需求不断增加,股权质押成为他们获得现金流的第一选择,因为股权质押在上市公司融资方面有着时间短、成本低的优势,所以股权质押已经成了上市公司主要实际控制人的首选融资手段。在我国当前的上市公司中,利用股权质押进行融资的公司数量越来越多,且进行股权质押的比例也在不断增加,同时循环质押融资的情况也屡见不鲜。股权质押的方式之所以受到大部分实际控制人的追捧,是因
随着我国金融市场的不断成熟以及计算机技术的迅速发展,对高频交易管制的放开势在必行。高频交易作为先进计算机技术与金融市场结合的产物,不管是对金融市场本身还是对市场参与者都产生了重要的影响,尤其是高频交易与股票“闪崩”之间的相关性,一直是学界和业界探讨的重点。本文主要研究了高频交易对我国股票市场“闪崩”的影响,选取了2016年和2017年A股上市股票的分钟级别交易行情数据作为样本数据,借鉴了国外学者B
目前,我国正处在货币政策操作从数量型为主向价格型转变的阶段,货币政策的中介目标、传导机制、调控框架等都面临创新与突破。在价格型的货币政策框架下,利率走廊是美欧等发达国家的央行较为普遍的做法。我国“十三五”规划中明确提出要“完善货币政策操作目标、调控框架和传导机制,构建目标利率和利率走廊机制,推动货币政策由数量型为主向价格型为主转变”。近年来,人民银行尤其注重培育市场利率体系,强化价格型的调控和传导