论文部分内容阅读
随着债券市场信用风险爆发,近年来债券违约事件频频发生。以客观数据为基础,采用计算机相关技术进行违约预测,对于债券投资者以及从业人员有着重要的意义。在债券违约问题中使用较多的传统金融模型主要针对发债主体为上市公司的债券进行分析预测,对大量非上市公司的债券缺乏预警能力。同时,在债券数据中存在众多的关系数据以及类别数据,如何合理利用这些数据对债券违约进行预测具有重要意义。因此,本课题利用债券及发行人公开的多源信息以及宏观经济数据,使用知识图谱及深度学习技术进行债券违约预测。在构建债券知识图谱的基础上,使用知识表示学习技术对知识图谱中的知识进行向量化表示,并将这些提取到的向量作为一部分特征输入到深度学习模型中,对债券进行违约预测。本文主要研究内容包括以下方面:债券信息的获取及预处理。债券违约的影响因素众多,本文主要利用债券及发行人的公开信息以及宏观经济数据进行违约预测。通过数据供应商的API接口以及网络爬虫,获取到债券的相关信息。对债券进行筛选,并对数据进行清洗及预处理,为后续构建债券知识图谱和违约预测提供准确的数据保障。债券知识图谱的构建以及基于知识表示学习的知识向量化表示。针对债券信息包含多种关系的特点,构建债券知识图谱,债券知识图谱可以将债券市场中纷繁复杂的关系清晰地展示出来。利用知识表示学习模型学习知识图谱的语义信息、结构信息,作为债券违约的先验知识补充。使用TransE、TransH、TransR这三种知识表示学习技术将实体、关系映射到向量空间中,将债券用低维稠密的向量进行表示。基于深度学习模型的债券违约预测问题研究。通过对已违约债券进行归因分析,抽取债券违约问题的相关特征。针对债券数据多类别特征的特点,提出了DeepFM-KG模型。模型将债券知识图谱的向量化表示作为先验知识输入到深度学习模型中,设置相应的实验,评测DeepFM-KG模型在债券违约问题上的表现。在评测结果对比中,本文提出的DeepFM-KG取得了相对较好的预测效果。