基于Stacking集成学习的我国信用债违约风险预警模型研究

来源 :暨南大学 | 被引量 : 0次 | 上传用户:jerryby001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自2014年首起债券违约事件打破刚兑之后,我国债券市场的信用风险开始暴露,债券违约开始进入常态化阶段。然而,由于我国债市起步较晚,国内债券信用风险管理领域的研究还不够丰富,市场运行机制、预警机制与法律法规还不够健全,在一定程度上妨碍了债券市场的健康成长。因此,如何及时识别并有效规避债券违约风险,成为当前我国金融界探讨的新热点。在科技金融深度融合发展的时代背景下,本文利用我国信用债市场的公开数据和多层次的指标体系,构建了一个以支持向量机模型、随机森林模型和Light GBM模型为基模型,Logistic回归模型为元模型,贝叶斯优化算法为参数优化器的Stacking集成信用债违约风险预警模型。研究发现,该集成模型在测试集上AUC值、TPR值和TNR值分别达到了0.9507、0.9565和0.8693,优于所有对比模型,表明该集成模型在正负样本中均具有出色的信用风险识别能力。此外,本文还利用SHAP框架进行了模型的可解释性研究,提示了指标体系中的非财务信息及其衍生指标对于债券信用风险识别的重要作用,以及财务信息中的成长性指标、资本结构指标和运营指标应得到着重关注,为市场各方参与者的风控工作提供了参考和决策依据,具有较大的理论和实践意义。
其他文献
学位
改革开放四十年来,中国经济实现了高速增长,人民生活质量也随之稳步上升,但同时滋生了环境恶化和资源短缺等问题,如何平衡经济发展与环境保护问题已然成为当前亟需解决的难题。2020年,习近平总书记提出了碳达峰和碳中和的发展目标。基于上述背景,以30、60目标为导向,通过发展绿色信贷引导科学技术绿色化创新,来实现经济高质量发展是政府施策的重点。本文理论部分通过研究绿色信贷与经济发展现状,构建了绿色信贷助推
学位
本文将“一带一路”倡议作为一项准自然实验,并且使用CSMAR数据库中2011-2017年A股上市的对外直接投资企业数据作为研究样本,通过建立双重差分模型检验“一带一路”倡议的提出会给企业产能利用率带来什么影响。基准回归结果表明,企业的产能利用率能够在参与“一带一路”建设后得到显著提升。随后本文还进行了异质性检验,产能过剩异质性检验结果表明,对于原本就存在过剩产能的企业,“一带一路”倡议对其产能利用
学位
作为中国最具代表性的一项区位导向型政策——开发区政策,自1984年设立首批试点城市始至2018年公布最新版的《中国开发区审核公告目录》止,开发区政策是否真实有效地促进了区域经济发展以及各地区先于政策就已经存在的差异因素对开发区政策的异质性影响成为本研究的关注焦点。具体而言,本文是借助微观企业视角,采用2001-2009年中国工业企业数据库面板数据,利用双重差分方法评估中国开发区政策对政策试点县级区
学位
近年来,我国经济进入中高速增长的新常态,但现阶段制造业企业创新投入与创新产出之间存在的不平衡,以及企业间技术溢出吸收利用相对落后问题直接制约了我国制造业转型升级。因此,基于我国制造业企业微观数据研究企业研发与技术溢出的互补性,分析市场竞争、企业研发、技术溢出对企业创新的影响效应,对于提高制造业企业创新表现且以此推动制造业高质量发展和转型升级意义重大。以我国制造业2007-2019年期间的1678家
学位
学位
在地铁工程中,新建隧道的施工不可避免地会对既有隧道结构产生影响。针对广州地铁18#线盾构隧道下穿既有地铁8#线区间隧道的工程背景,基于合理假定条件,采用midas GTS三维有限元分析软件建立数值模型,分析了新建隧道盾构施工过程对上部既有区间隧道结构的影响。数值分析结果表明:地铁18#线盾构掘进过程中,地铁8#线区间隧道结构最大水平X位移值为0.27 mm,最大水平Y位移值为0.84 mm,最大竖
期刊
随着老龄化程度的加剧,各种老年疾病也相应增多,其中代谢综合征就是一种常见的老年疾病,该病使患者出现多种疾病的聚集,给患者的健康带来严重危害,显著提高患者心脑血管等其他疾病的患病风险与严重程度。同时,由于其是复杂的多系统疾病,症状复杂多样,难以进行精准识别与诊断,给医疗诊治也带来巨大的困难与挑战。针对代谢综合征识别与诊断难的现状,而中医作为我国传统医学,具有早发现早治疗、副作用小等诸多优势,在代谢综
学位
随着生活水平的提高,越来越多的消费者具有了购买汽车的能力,不仅是新车,二手车也纳入了选择范围之内,2021年的二手车交易量已经突破了1600万辆。但是在二手车交易过程中的一些问题也随之暴露出来,如交易流程不透明、缺乏统一的评估标准等。本文在总结前人的研究基础上构建了二手车评估指标体系,采用Stacking框架,构建了一个第一层为支持向量机、随机森林、GBDT、XGBoost和KNN,第二层为多元线
学位
随着我国城市化和工业化进程的快速发展,空气质量问题日益突出,目前对空气质量的研究存在预测精度低,预报时间短等问题。因此,如何对空气质量情况进行准确预报,并分析其内在相关因素的影响程度,对全社会至关重要。现有的CMAQ系统依靠物理化学方式,消耗了大量计算资源,能对空气质量进行预测,但随着预测时间延长,预测精度降低,且滞后于真实值,达不到期望的预警效果。因此,本文将CMAQ未来几天的预测值作为特征变量
学位