基于事件序列的上市企业债务违约行为分析及预测

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:hoget
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从债券市场的诞生起,人们就开始不断使用各种数据模型来进行机器学习,并且利用数据挖掘等技术手段来预知债务违约的情形,以此避免危机,其中逻辑回归模型,以及神经网络模型算法也被广泛应用。然而在经济历史研究中,人们多采用结构化数据如资产负债表、市场数据、以及宏观经济历史数据进行建模与预测,而对于将非结构化数据,如政治事件、舆论舆情以及企业信息添加到建模中进行债务违约预测的研究则较少。本文在梳理了历史上学者对于债务违约情况的建模研究的基础上,探讨了逻辑回归模型、BP神经网络模型对债券违约进行预测的可行性,并作出相应对比以研究模型准确性。本文从三个方面对使用事件序列数据预测债务违约进行研究。第一方面是黑白样本不均衡的研究。由于债券违约存在天然的违约事件远远少于非违约事件的情况,我们采集到的样本比例极不平衡,这对模型效果产生了较大影响,因此我们采取了欠采样的方法,对不同比例的黑白样本数据进行建模和训练,并对比其预测效果。在对比之后,我们发现,随着黑样本数量所占全体样本数量比例的不断增大,债务违约的预测更加准确,且当黑白样本处于均衡状态时,违约样本的预测率较好。第二方面是特征的构建。由于事件序列是符号化结构数据,因此对于机器学习和神经网络的模型均不适用,对于逻辑回归模型而言,本文采用固定时间窗内某只黑样本的负债主体发生事件的次数作为变量,建立逻辑回归模型。对于神经网络模型,本文采用了三种特征处理方式,分别为数字编码、one-hot编码以及word2vec编码。数字编码可以较为简洁的用数字代替事件,但存在事件间有大小关系比较的误区;one-hot编码是使用维度为17的向量代表17种不同的事件,消除了数字编码的大小比较歧义,但是one-hot编码的变量较为稀疏,内存占用大,运算效率较低;word2vec编码首先使用神经网络建立特征,每个事件用从17维的one-hot变量转为5维特征变量,该种变量既可表示不同事件间的相互关系,又不存在大小比较关系。将三种变量带入BP神经网络中后,我们发现使用word编码的数据训练出的模型效果最好。最后,本文比较了逻辑回归模型和神经网络模型的效果差异。在事件序列预测债务违约的任务中,逻辑回归模型的适用性更好。本文的研究内容在一定程度上补充了债务违约预测中对非结构化数据的利用,通过对金融事件序列预测债务违约进行多种特征处理和模型建立,寻找对该类数据的较好处理方式与建模方法,进一步提高债务违约预测模型的准确率。
其他文献
随着互联网技术与物流的发展,网上购物以及搜索产品相关信息变得越来越方便,因此催生出了“在线下实体店评估产品-在线上低价购买产品”以及“在线上搜索产品相关信息-在线下购买产品”这两种零售现象,即展厅现象与反展厅现象。这两种现象的出现改变了线下传统零售商与线上电商之间的竞争情况,引起了大量企业与研究者的关注。线下传统零售商是否为展厅现象的受害者、反展厅现象的受益者?线上电商是否为展厅现象的受益者、反展
学位
受新冠疫情的持续影响,企业的生产经营遭遇到了前所未有的挑战。在当前的特殊时期,缓解企业的债务融资成本,推动中国经济复苏,具有现实意义。媒体在新时代焕发出新活力,随着网络的快速发展,媒体的传播成本急速下降,传播效率直线上升,对社会经济生活的影响也越来越大。企业作为市场经济中的不可忽视的一份子,媒体情绪对企业的债务融资成本会产生何种影响,是否是企业降低自身融资成本的一种新途径?不同的媒体情绪对企业债务
学位
在互联网技术不断发展的时代中,面对庞杂丰富的网络信息,信息的自动准确获取十分重要。信息抽取技术能够对非结构化文本进行自动分类、提取和重构,主要包括命名实体识别、实体关系抽取和事件抽取等任务。在各个垂直领域中,金融行业的信息需求尤为明显,快捷准确地从海量金融文本中获取结构化信息有助于监管者和投资者科学决策,并且实际工作中,金融信息往往以公告、财经新闻和研究报告为内容载体,文本篇幅长又包含动态事件描述
学位
对从酿造白酒的大曲和麸曲中筛选出的细菌进行了酸性蛋白酶酶活性的测定,并对方法进行了验证与优化,结果表明当发酵时间为168 h时,固体培养基A产生的酸性蛋白酶的酶活性达到最高值。并用该方法对不同来源细菌的酸性蛋白酶酶活力进行了测定,在实验室筛选了一株蛋白酶活性较高的细菌,其活力最高能达到249.3 u/g。
期刊
随着信息技术的迅速发展,各大高校的业务也逐渐智能化,多样化,信息化.高校的食堂饭卡、图书馆卡、热水卡合为一体,出现了校园一卡通。校园一卡通的出现,无疑给高校的信息化建设与管理做出了巨大贡献,但随之而来的问题是,高校作为一个人群密集的地方,每天都会不断涌现出与学生密切相关的各式各样的数据,如何合理的将这些随着时间增长的海量数据进行有效的存储及其分析利用是需要研究的一个问题。据了解,现在大多数高校的信
学位
会计信息可比性作为重要的会计信息质量特征,能够反映出不同经济业务之间的异同,有助于银行等信息使用者了解企业的财务状况和经营成果。优化资源配置效率。银行贷款在我国债务融资中占有很大比重,企业贷款可获得性一直作为社会关注的热点问题。会计信息可比性能够改善银企之间的信息不对称性,完善不完全契约,提高了企业的贷款可获得性。但是会计信息的供给和需求本身就是多方利益相关者博弈的结果,会计信息的主观判断和人为操
学位
中小股东是促进我国资本市场健康稳定发展的重要基石,而上市公司大股东侵占中小股东权益的现象十分普遍,因此保护中小股东合法权益至关重要。机构投资者可以采取股东积极主义有效改善公司治理从而促进中小股东保护,然而同样追求超额回报的机构投资者也可能与控股股东相互串通,损害中小股东合法权益。那么,机构投资者是中小股东权益的保护者还是大股东的合谋者呢?因此,本文对机构投资者异质性与中小股东保护的关系进行研究,并
学位
自从2014年员工持股计划在我国重新引入之后,许多上市公司都踊跃实施了员工持股计划。但是近些年来,员工持股计划浮亏层出不穷。员工持股计划本意是激发员工的工作热情,最终却将员工暴露于股价波动的风险中,并为此承担了巨大的损失,这与员工持股计划设计的初衷相违背。那是什么原因导致这种现象的发生呢?是否存在上市公司借助员工持股计划采用盈余管理的方式推高股价的可能呢?因此,需要挖掘其中的原因。本文以2014-
学位
报纸
当前,中国的外贸发展正处在换挡加速和结构转型的关键时期,提升出口产品质量是推进我国对外贸易转型升级的重要途径。产业聚集作为企业发展的重要载体和战略途径,可以促进区域经济发展和社会进步。随着互联网技术的不断发展,数字经济已经成为驱动国家经济发展,参与形成国际竞争新格局的中坚力量。因此,为了探索数字经济发展与中国出口产品质量之间的关系,本文从微观角度出发,利用我国城市层面的面板数据研究了数字产业聚集对
学位