基于SVC-Stacking集成学习的上市公司ST风险预警研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:cracezhangxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
上市公司因财务状况异常或其他情况异常而发生特别处理变动,是我国特有的ST制度。从理论上来说,ST制度向投资者警示了该类股票有较大风险,继续投资可能会面临巨大损失。然而在资产重组和壳资源炒作下,ST股却成为了热点板块。即便有极个别投机者从中获利,绝大部分跟风投资者往往损失惨重。为了加强保护投资者权益,严厉打击此类证券违法违规活动,证监会深化退市制度改革。随着注册制改革稳步推进,常态化退市机制逐步建立,资本市场优胜劣汰机制加速形成,投资者也重点关注着上市公司的ST风险。上市公司财务状况恶化往往是逐渐演变的过程,若能根据一些信息预测ST风险,或可减少投资的盲目性,或可调整公司经营决策避免ST发生。本文从保护投资者权益出发,提出构建集成模型预测上市公司面临的ST风险。常用的ST风险预警模型有判别分析模型、逻辑回归模型、机器学习模型以及神经网络模型。对比发现,判别分析模型虽然计算简便,但有着严格的假设条件。逻辑回归模型利用最大似然函数进行参数估计,因此对样本量有所要求。目前,机器学习和神经网络模型被广泛应用于无人驾驶、潜在犯罪预测、检测信用卡欺诈等多个领域,均有不错表现。因此,本文采用机器学习方法对上市公司ST风险进行预测。常用的集成学习算法通常有三类:袋装法(Bagging)、提升法(Boosting)和堆叠法(Stacking),本文基于Stacking思想融合单一机器学习模型,将支持向量机模型(SVC)、逻辑回归模型(LR)、决策树模型(DT)和朴素贝叶斯模型(NB)组合,提高ST风险预警模型的分类预测结果。在预测样本的选择上,国内学者往往在研究财务困境等问题时直接将ST企业等于财务困境企业。本文认为这是不合理的,因为财务困境是从现金流量角度进行衡量,而特别处理变动从盈利能力角度进行评估。基于此,本文选取了2018—2021年间A股市场的150家ST企业和450家正常企业,从财务因素和非财务因素等方面共选择了49个预测指标,收集了样本公司ST变动前六年的相关数据,数据来源于国泰安数据库(CSMAR)。在描述性统计中发现,样本数据存在异常值。数据归一化处理后,本文利用Filter过滤法进行方差过滤,考虑到方差很小的特征无法用于区分样本,因此消除方差为0的特征。接着对特征进行主成分提取,减少共线性等问题的同时,尽量减少了原始指标所包含信息的损失。根据支持向量机算法基本原理,本文训练了基于SVC算法的ST风险预警模型并利用网格搜索和五折交叉验证进行调参优化,输出最优的ST风险预测模型。评估各个模型的分类效果时主要选取了准确率、精确率、召回率、F1得分和AUC值等指标。实验结果表明,样本数据是非线性且不平衡的,在双曲正切核函数(sigmoid)和1∶3的权重参数(class_weight)下,SVC模型有着较高的预测准确率(88.89%)和召回率(90.48%)。比较不同提前期数据下的SVC模型发现,t-1、t-2以及累计两年的提前期样本数据集的模型预测性能更好。利用Stacking多模型融合思想,将LR、DT、NB模型作为Stacking算法的第一层基学习器,使用基于SVC的ST风险预警模型作为第二层基学习器构建集成模型。在最优超参数组合和三折交叉验证下重复进行20次实验,结果表明SVC-Stacking集成模型的整体预测准确率平均值为89.75%,召回率平均值为90.25%,和单一的SVC模型相比分别提高了约7.53%和2.31%,且集成模型的评价指标波动曲线在所有模型中是最小的。不难看出,集成模型可以捕捉出90%以上有ST变动风险的上市公司,预测性能和稳定性都优于单一模型。因此,本文认为集成模型在上市公司ST风险预测中有着较高的实用价值。
其他文献
《中共中央国务院关于做好2022年全面推进乡村振兴重点工作的意见》即2022年中央一号文件提出,要加大对乡村旅游的发展,引导并鼓励农民参与乡村民宿的经营。中国十四五规划纲要提出,要大力发展民宿经济、乡村旅游等特色休闲产业。民宿作为旅游业的新业态形式,不仅能够促进旅游业整体的发展,也是助力乡村振兴战略的重要抓手,所以国家大力鼓励民宿行业的深入发展。其中于2020年8月发布的《江西省人民政府办公厅关于
学位
2008年的金融危机使学者们认识到金融稳定的重要性,重新思考商业银行在货币政策传导渠道中的扮演的角色,提出了货币政策的一条新的传导渠道:银行风险承担渠道。该渠道认为,在货币政策传导过程中,银行并非仅仅是风险中立的传导中介,货币政策会影响银行风险承担意愿的调整。然而银行风险承担渠道与其他货币政策传导渠道密切相关,在对该渠道进行单独考察时,倘若没有事先排除其他渠道的干扰,则会削弱研究的可靠性。同时,伴
学位
现阶段,我国经济正向高质量方向转变,同时正面临着新一轮的革命;数据资源已成为一项重要资产,不仅在国民经济运行中扮演着重要角色,而且在实现社会主义现代化建设过程中也发挥着至关重要的作用。在提出将数据作为生产要素参与市场配置的今天,如何有效测度数据要素对经济社会的赋能效应,揭示数据新动能的发展水平,挖掘数据要素的潜在价值,是目前亟需解决的问题。对此,本文从ICT产业视角出发,基于2010-2019年3
学位
小学数学是小学教育阶段的基础课程,提升小学数学课堂教学效率有助于贯彻落实“双减”政策。然而当前小学数学教学中还存在一些问题,影响学生的数学核心素养培育。“双减”政策要求教师在教学过程中尊重学生的主体地位、融入与生活相关的内容、培育学生的数学核心素养。因此,为了切实提升小学数学教学质量与学生课堂学习效率,教师要立足“双减”政策要求,采取改善不良情绪,激发学生积极情感体验;加强教育信息化建设,增强课堂
期刊
小学数学教师基于智慧课堂开展小学数学教学,能够实现对传统教学形式的调整。为此,教师要结合学生的发展特点、能力基础等,对原有的教学方案做出调整,以助力学生完成对知识的深入理解,让其主动参与对新知的探索,形成良好的学习习惯,逐步发展数学核心素养。教师要对智慧课堂的价值和作用进行正确的认知,在教学过程中要合理引导学生,让其主动参与并高效完成学习,逐步形成良好的数学思维和数学素养,进而取得良好的发展。
期刊
中国经济经过40多年的高速发展,取得了丰硕的成果。现阶段我国经济发展已经步入“新常态”,从高速发展转向高质量发展,经济的高质量发展将是我国各项领域发展的未来主题。就业作为最大的民生,其高质量发展将是各个领域的重要基石。而农业转移人口作为我国经济发展的重要支柱力量,其就业质量虽然经过较大的提高,但总体上仍处于低位,普遍存在着工资低、劳动强度大、就业稳定性差和社会保障不足等问题,其就业质量仍有非常大的
学位
家庭是社会经济活动的基本单位,而家庭参与投资的活跃程度也是我国经济活力的重要表现,近年来,我国的家庭开始越来越重视理财,越来越注重金融资产配置,2021年10月由欧洲安联集团发布的《2021年安联全球财富报告》显示,2019年与2020年中国家庭金融资产总额的增长连续两年超过10%,增速远高于全球平均水平,2020年中国家庭金融资产总额超过2.5万亿欧元(约合人民币18.6万亿),占亚洲地区金融资
学位
在互联网技术还未发展成熟以前,在风险评估领域,一般采用传统的计量模型,使用少量的贷款用户数据,来制定一套评估信用风险的准则。而随着计算机的高速发展,大数据时代的来临,借贷机构可以轻松获取大量的贷款数据,如果直接使用传统计量模型,由于其模型的解释能力较差、拟合不完全等问题,在此场景下将其用于信用评估将会丢失大量有用信息。而机器学习模型能够处理高维度、大样本的数据,能够极大地提升信用风险评估的准确性。
学位
伴随着社会的发展进步,整个社会生活对电力的需求量很大。电力负荷预测是当前一个重要的研究领域,因为负荷预测存在于电力系统的各个方面。优秀的电力负荷预测模型不仅可以有效的提高资源的利用率,还可以提升负荷在电力市场的灵活性,对电力系统至关重要。为了提高预测精度,提出了一种基于改进鲸鱼优化算法(IWOA)和注意力机制(Attention)的双向长短期记忆网络(Bi-LSTM)的电力负荷预测方法。该方法接收
学位
中职信息技术课程与课程思政的融合教学,有助于提升学生的思政素养和信息素养,践行立德树人的根本任务,塑造正确的价值观。然而,这种融合过程中存在思政元素挖掘不足、教师课程思政教学能力不足以及融入方式单一等问题。因此,需要探索解决措施,以创新中职信息技术课程教学模式,充分发挥育人合力。
会议