【摘 要】
:
中文信息作为数据要素的重要组成部分,在智能财务风险识别中发挥着积极作用。鉴于此,基于词频统计技术构建了用以衡量文本情感基调与语气倾向的指标体系,通过对2012—2019年中国上市公司年报中管理层讨论与分析(MD&A)所披露的信息进行度量,实现了中文文本信息的量化;进一步,在对结构化文本数据和财务数据进行融合的基础上提出了基于机器学习的智能财务风险识别系统。实验结果显示,相对于仅使用单一财务数据而言
【基金项目】
:
安徽省哲学社会科学规划重点项目“基于大数据的区域性金融风险量化与控制机制设计”(AHSKZ2018D14);
论文部分内容阅读
中文信息作为数据要素的重要组成部分,在智能财务风险识别中发挥着积极作用。鉴于此,基于词频统计技术构建了用以衡量文本情感基调与语气倾向的指标体系,通过对2012—2019年中国上市公司年报中管理层讨论与分析(MD&A)所披露的信息进行度量,实现了中文文本信息的量化;进一步,在对结构化文本数据和财务数据进行融合的基础上提出了基于机器学习的智能财务风险识别系统。实验结果显示,相对于仅使用单一财务数据而言,文本信息的融入能够有效识别上市公司财务风险;基于树的机器学习模型和集成学习模型的识别性能显著优于基准模型,其中RF与GBDT模型的识别效果最好。将中文信息引入智能财务风险识别,不仅有利于提高识别性能,而且有助于挖掘社会数据资源价值,为我国的数据要素市场建设以及人工智能战略的实施提供参考。
其他文献
基于“危险性-暴露性-脆弱性”的内涝风险评估框架,采用层次分析法构建了北京城市副中心内涝风险评估体系,运用模型模拟法、GIS空间分析法等多种方法获取评估指标值,对研究区进行了10、20、50年一遇降雨情景下的内涝风险评估.研究结果表明:(1)副中心现状排涝能力基本满足10年一遇降雨,距离规划50年一遇的排涝标准有较大差距;(2)中高风险区主要集中在北运河以西、通惠河以南的原通州老城区,运潮减河以北
概率极限理论是概率论的主要分支之一,也是概率论的其他分支和数理统计的重要基础.一直以来,独立随机变量是概率极限理论研究的基本对象.关于独立随机变量的经典理论在20世纪30年代和40年代已获得完善的发展.在实际问题中,我们研究的随机变量序列通常是不独立的,随机变量序列之间总是存在这样或那样的相依性.因此相依随机变量序列的理论研究引起广泛关注.一些相依随机变量的引入不仅是理论上研究的必要,如在马氏链,
概率极限理论是概率论的主要分支之一,也是概率论的其它分支和数理统计的重要基础.近代概率极限理论的一个研究方向是在于削弱随机变量序列对“独立性”的限制,使其更贴近实际并利于应用.本文研究了若干相依随机变量序列部分和的收敛速度,推广和改进了前人的一些结果.文章主要内容如下:绪论介绍了几种相依随机变量,收敛性的定义及其关系,两两NQD列的研究进展,精确渐近性及其研究进展.第一章讨论了稳定律吸引场中两两N
本文研究某些子流形几何和特征值问题,内容分为四个部分.第一部分研究局部对称空间中极小子流形的刚性定理Yau S T在文献[1]中研究了常曲率空间中的紧致极小子流形,得到了一个与SimonS不等式类似的结果.本文考虑了局部对称黎曼流形的极小子流形某些刚性定理,通过对于任意实数a的取值,得到了关于第二基本形式模长平方,截面曲率的一些不等式,将Yau文献中的结果推广到了局部对称空间中.证明了如下定理2.
媒体融合给人力资源管理带来全新挑战,一身才华的从业者不仅要专业能力过硬,还要具备一定的心理学常识,进而对事有更加敏锐的洞察,对人有更为客观的判断,营造组织良好的工作氛围,更充分利用"人"这个最具活力的一线资源,助推传统媒体更好更快地转型发展。
Wigner函数是定义于相空间中的准概率分布函数,是最常用的量子相空间分布函数之一。尤其是对某些化学物理问题,它具有简单而且物理内涵丰富的特点。自从弦理论与非对易理论之间的关系被揭示以后,有关非对易空间各种物理问题的研究引起了理论物理学界的广泛关注。我们知道在弦尺度下,出现了空间的非对易效应,坐标与坐标不再对易。在本文中我们把它分为两种情况进行讨论:一种情况下坐标与坐标不对易,但是动量与动量依然满
针对智能船舶航行过程中的航行关键风险因素的有效识别和筛选问题,本文提出基于等级全息建模(Hierarchical holographic modeling,HHM)框架和风险过滤、评级与管理(Risk filter, ranking and management framework,RFRM)思想的智能船舶航行风险识别与筛选理论。首先,构建智能船舶航行风险识别HHM模型,以全面而准确地选取和反映智
概率极限理论是概率论的主要分支之一,也是概率论的其他分支和数理统计的重要基础.在20世纪50年代中期,继独立随机变量和的经典极限理论获得较完善的发展之后,随机变量的相依性概念就在概率论和数理统计的某些分支中被提出来,因为一方面由于统计问题的需要,如样本非独立性,又如一些独立样本函数的非独立性;另一方面出于理论研究及其它分支中对相依性的要求,如在马氏链、随机场理论及时间序列分析等问题中.对于概率极限
概率极限理论是概率论的主要分支之一,也是概率论的其他分支和数理统计的重要基础.本文主要研究了行为两两NQD随机变量阵列加权和的收敛性,内容包括:在h-可积条件下行为两两NQD随机变量阵列加权和的Lr收敛性和完全收敛性;行为两两NQD随机变量阵列行和最大值的收敛性(包括弱大数定律、Lr收敛性和完全收敛性),以及两两NQD随机变量序列部分和之和的强大数定律.主要内容如下:第一章绪论.给出两两NQD随机
概率极限理论作为概率论的主要分支之一,是概率统计学科中极为重要的理论基础.经典的极限理论包括中心极限定理,大数律,重对数律等,相对于收敛性来讲,就是依分布收敛,依概率收敛和几乎必然收敛等.极限理论最初主要以研究独立随机变量为主,但是许多统计问题涉及到加权和的收敛性,在理论研究和实际应用中也更为广泛,所以对加权和的研究是非常重要的.本文主要讨论了两类随机变量序列加权和的收敛性质.一类是B值独立随机元