基于随机森林的上市公司舞弊风险识别模型研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:mujun1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下我国处于金融体制转型的关键时期,正逐渐成为全球经济增长的重要驱动力。然而过去二十年间上市公司舞弊丑闻频发、屡禁不止,沉重打击投资者和社会公众对资本市场的信心,使得公司财务报告公信力下降。能否有效治理公司舞弊这一资本市场顽疾,将决定新兴时期资本市场与实体经济有效对接的成功与否以及供给侧结构性改革下产业转型升级的效率、效果,会计理论界、实务界和监管机构对此都高度关注。研究表明相较于案例分析,模型识别舞弊效果更优。现阶段在舞弊识别指标方面的研究相对完善,舞弊识别模型的构建上还有待探索。基于此本文将随机森林算法引入识别上市公司舞弊,对保持资本市场有效活力具有极其重要的现实意义。随机森林(Randomforest)作为一种组合分类器算法,在大样本、高维度特征和异常值数据上仍能保持较高的预测准确率,是非线性建模的重要工具之一,近年来在生物信息学、医学、社会科学等领域研究成果颇丰,并且在风险识别与预警中展现出极大的潜力。基于此本文构建了基于随机森林的上市公司舞弊风险识别模型,相关数据处理和模型构建均在Python环境下编程实现。本文首先从舞弊动因探索与理论分析、舞弊风险识别指标、舞弊风险识别方法三个方面进行文献梳理,详细探讨舞弊风险识别模型的研究成果、前沿动态和存在的不足之处,在此基础上将随机森林算法引入上市公司舞弊风险研究,详细介绍随机森林的基本原理、优缺点和模型构建的可行性。其次选取2014年——2017年间发生舞弊的430家A股上市公司及相同数量的配对公司作为研究样本,从公司治理、信息披露水平、特殊事项及行业压力和财务稳定性角度选择指标初步建立指标体系,采用探索性数据分析(EDA)和随机森林算法深度挖掘初选指标特征、修缮指标体系,然后构建基于随机森林的上市公司舞弊风险识别模型,进行模型判别精度检验和模型性能比较。结果表明本文构建的舞弊风险模型识别效果较好,在高维度样本上有很好的表现效果且性能稳定。最后,基于以上理论分析和实证研究,总结全文并提出本文的不足之处与研究展望。
其他文献
从浸铝前的表面处理、铝液成分、浸铝温度和时间的选择、浸铝后的热处理、热浸渗铝工件的性能及应用等方面,介绍了国内外热浸渗铝工艺的新进展。分析了目前的热浸渗铝工艺存
以当今热点中国老龄化问题为背景,从老年人养老观念、养老模式出发,以上海提篮桥历史风貌区的里弄住宅为研究对象,对其功能、格局等方面进行适老化改造,使之更适宜老年人居住
面对飞速发展的无线音乐市场,以语音下载为主的传统营销方式已不能适应南昌移动的发展实际。因此,开展新形势下南昌移动无线音乐营销推广策略的研究,对于南昌移动的发展具有
<正> 一、关于事物变化发展的思想《易经》的作者,根据人类长期同自然作斗争的经验,逐步形成宇宙万物不断变化、绝非一成不变的观念。他们首先观察到日中则昃,月盈则亏,寒暑
目的运用循证医学方法,通过多中心随机对照临床研究评价"整颈三步九法"治疗颈椎病的有效性和安全性。方法采用多中心、大样本临床研究方法,各临床中心同步按照纳入标准共纳入
<正>缺血-再灌注损伤(ischemic reperfusion injury,IRI)是一种常见的临床病理生理过程,当组织或器官发生缺血一段时间后,重新恢复缺血组织或器官的血流灌注或氧供应,将会造
会展业不仅是海南国际旅游岛建设的一个重点,也是一大亮点。本文运用SWOT分析方法,就海南会展业发展的优势、劣势、机会和威胁进行了分析,提出了海南会展业发展的对策建议。