基于图卷积网络的个人信用风险评估应用研究

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:yuanwenrui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用风险是信贷业务的主要风险来源。近年来,随着社会经济的快速发展,信用消费的经济形式越来越普遍,违约风险也随之增多。我国目前的信用现状仍存在很多问题,严重的违约风险很大可能会影响社会经济的健康发展。如何准确和全面地对个人信用风险进行评估是银行等金融机构的重要任务和必然要求。传统的信用风险评估方法过于依赖个人征信,缺乏时效性和全面性。大数据时代的到来提供了丰富的数据,加上深度学习技术在多个领域内的成功应用,越来越多的研究人员运用深度学习方法进行信用风险评估。如何充分利用深度学习方法全面地进行信用风险评估是目前思考的主要问题。目前信用风险评估的方法主要分为三类,包括基于数学建模的方法、基于统计学的方法和基于机器学习的方法。上述方法一般都是基于借款人自身的特征信息对其信用风险进行评估,没有考虑借款人之间的关系信息。研究表明,个人信用风险不仅仅与借款人自身的特征信息有关,还与借款人之间的关联关系有关。借款人之间的关系中蕴含的信息对进行个人信用风险评估十分有价值。如果某个借款人存在违约风险,那么与之相关的其他借款人也有可能受到影响。因此,充分考虑借款人之间的关系信息在信用风险评估问题中具有重要意义。图数据常常用来描述对象之间的关系。与向量相比,图结构表示的信息更加丰富,包含对象本身的属性特征和对象间的关联信息。对象可以作为图结构的节点,对象间的交互关系或相关性可以使用图结构的邻接矩阵来表示。由于图结构可以包含更多的信息,近年来使用图结构表示现实数据已经成为机器学习和数据挖掘的研究热点。因此,可以将借款人特征信息及其和其他借款人之间的关系信息表示成图结构数据,并通过对图数据进行分析,实现对个人信用风险的预测。为了更好地利用大数据和深度学习进行个人信用风险评估,提高信用风险预测准确率,本文基于图卷积网络进行了信用风险评估问题的应用研究。深度学习的巨大成功得益于卷积神经网络的发展,将深度学习的方法迁移到图数据中是当下研究的热点。图数据相关的任务一般可以分为图节点分类任务和图分类任务。对以节点表示的借款人进行信用风险评估属于节点级别的分类任务。因此在本文中,我们重点关注图节点分类问题。传统的卷积神经网络只能处理图像、语音等结构规则的欧式空间数据,不能应用于非欧空间的图数据。这是由于欧式空间数据具有平移不变性,可以定义全局共享的卷积核。图数据中每个节点的邻居节点个数和排列顺序不同,不具备平移不变性。在图数据上定义卷积算子和池化算子是将卷积神经网络迁移到图数据上的关键。目前对图卷积神经网络的研究方法主要分为两类:谱方法和空间方法。基于谱域的图卷积神经网络利用谱图理论和卷积定理,以傅里叶变换为桥梁,将图数据从空域转换到频域进行处理。过程中涉及到拉普拉斯矩阵的特征分解,计算开销较大,且只能处理固定大小的图。基于空域的图卷积神经网络从节点域出发,通过定义聚合函数来聚合中心节点和邻居节点的特征信息。目前出现的图卷积神经网络性能已经优于传统方法,但是仍然存在很多问题。例如本文关注的图节点分类问题中,随着网络层数的增加,节点特征将会趋于一致,即出现过平滑问题。过平滑问题的出现使得多数方法受限于网络的深度。此外,对于不同节点具有不同局部结构的图数据,一些节点只需要较小的聚合深度,否则噪声太多;一些节点需要较大的聚合深度,否则可学习的信息不足。在聚合邻居节点信息时如果只采用固定的邻域范围,则融合到的邻域节点信息不够准确。因此,针对目前存在的主要问题和不足,本文对应用于节点分类问题的图卷积神经网络模型提出了改进。本文首先将经典子图卷积网络应用于个人借贷信用风险评估问题中。基于子图的图卷积神经网络能够缓解节点分类任务中的过平滑问题。该方法首先采用子图提取的方法对原始图数据进行处理,分别以图中每个节点为中心提取规则的子图;之后在每个子图上进行卷积操作,交替堆叠卷积层和池化层提取特征信息;最后输出向量形式的节点特征,利用更新后的节点特征进行分类。该方法能够有效抑制图卷积神经网络中的过平滑现象。实验证明经典子图卷积网络在信用风险评估问题中的应用有效性。随后,针对节点局部结构不同时特征考虑不充分的问题,本文提出了一种新的混合图卷积神经网络。首先,该模型采用子图卷积算子和全局卷积算子分别进行卷积操作,提取局部信息和全局信息,分别输出新的节点特征矩阵;其次引入注意力机制进行特征拼接。采用注意力机制可以实现不同节点自适应的特征选择,从而获得充分全面的节点特征表示。该方法有效利用了图的局部信息和全局信息,对于局部结构不同的节点都获得了有效的特征表示,在一定程度上避免了特征考虑不充分的问题,提高了图节点分类的准确率。本文采用混合图卷积神经网络模型解决借款人信用风险评估问题,与其他图卷积神经网络模型以及传统机器学习方法进行了对比实验,实验结果证明了本文所提出算法在预测准确率上相较对比方法的平均提升幅度达到5%。
其他文献
商务部关于非金融企业的安全评估报告显示,近年来,企业的财务安全一直面临较大威胁,安全指数处于下滑趋势,多数企业存在过度盈余管理的现状。盈余管理指的是企业管理层通过对会计利润的调整改变财务报告中盈余信息的行为,所以过度盈余管理会对投资人的判断产生误导,破坏资本市场最优的资源配置路径,对企业的可持续发展以及资本市场的平稳运行产生严重不利影响。盈余管理的不利经济影响使得如何抑制企业的过度盈余管理成为当前
学位
2020年9月,我国向世界做出庄严承诺,力争于2030年前实现碳达峰,于2060年前实现碳中和。作为世界上最大的碳排放国家,我国在承诺碳达峰与碳中和之前,就已陆续实施了许多环境管制政策以实现节能减排,其中一项重要政策便是在2011年12月公布的,由国家发展和改革委员会等十二个部门联合印发的《万家企业节能低碳行动实施方案》(发改环资[2011]2873号,简称“万家企业”政策)。该政策以“2010年
学位
党的十九届五中全会报告《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》中提出把“多层次社会保障体系更加健全,卫生健康体系更加完善”作为国家的重大战略部署,并且将“民生福祉达到新水平”作为“十四五”时期经济社会发展的六大目标之一。财政作为国家治理的基础和重要支柱,对构建完善的医疗卫生系统、实现“十四五”时期经济发展目标有着重要作用。政府提高医疗卫生领域支出的有效性和合
学位
城投企业作为地方政府提供城市公共物品的有力工具,在支持地区基础设施建设、改善居民生活水平、促进区域经济平稳发展等方面发挥了重要作用。曾以地方政府融资工具为定位的城投企业,尽管其独立经营能力较弱,但由于政府兜底即隐性担保的存在,使得城投企业融资成本与其经营实力相脱节,由此给地方财政的可持续发展埋下危机。随着地方隐性债务防范化解紧迫性的提升和城投企业政府融资功能的剥离,城投企业进入了市场化转型时期。而
学位
当下人口老龄化问题严峻,社保征收压力较大,为了加强社保费的征收,我国于2011年7月1日在全国范围内正式推行《社会保险法》,完善了相关的法律制度。由于之前我国社保工作的合规性较差,《社会保险法》的实施能够对全国的社保工作进行统筹,规范征管工作。有很多文献研究证实了该项措施对改善我国社保费的征收情况发挥了很重要的作用,在《社会保险法》实施之后,企业的参保程度明显提升。但另一方面,由于之前我国社保费的
学位
立场检测旨在判断一段文本的作者对某个目标(主题,观点)表示赞成,反对或中立的立场。学术界和工业界都十分关注立场检测任务的发展,在许多不同的领域中逐渐浮现立场检测的实际应用,例如医疗决策、产品调研、政治选举等等。其中,在政治选举领域中最常见的应用是民意调查或民意投票,使用自动立场检测技术,检测出一个地区(或网络社区)的群众对政策法规等的反应,维护社会安全与稳定。决策者可以获知群众对其决策的立场反馈,
学位
在当今这个互联网平台迅速发展的时代,人们对于精神娱乐的需求更加迫切,音乐成为人们精神娱乐的一种重要方式,互联网音乐平台蓬勃兴起。但海量的音乐信息让人眼花缭乱,如何解决信息过载问题、给用户提供个性化的音乐推荐成分为网络音乐平台发展的关键。本文梳理了传统推荐算法的发展过程与研究现状,发现单一的推荐方法存在一些缺陷,如用户特征画像难、新用户冷启动、推荐精度低、数据稀疏等问题。后续学者逐步使用更加多样的方
学位
随着世界城市化进程的不断推进,城市建筑需求量急剧增加,其相应的一系列建材和资源也产生了广阔的市场。识别建筑结构类型是衡量特定建筑所需建筑资源负担的先决条件,有助于建立建筑结构、材料和资源需求之间的联系以及建筑物抗震能力检测等等,从而有助于建立智慧城市形态、推进城市新陈代谢和生态规划等可持续城市研究。机器学习可有效助力建筑结构分类问题,其通常需要大量的有标注样本作为训练集构建机器学习模型。但在实际应
学位
近年来,数字化开始成为了世界商业环境中关注的重点,众多金融企业都在积极地向数字化、智能化方向转变,而中国也在十九大中明确提出了要加速构建数字中国。而这一数字化浪潮,离不开以区块链为代表的新技术的支撑。传统金融的数字化是大势所趋。供应链金融是一种全新的金融业务,其核心功能是银行将核心企业与其上下游企业捆绑在一起,并提供如融资贷款等相关金融服务。该金融业务诞生的初衷是为了解决小微企业难以融资的问题,然
学位
随着我国资本市场不断发展,上市公司数量不断增多,财务舞弊案件层出不穷,扰乱我国资本市场的同时也造成了投资者的经济损失。进行公司的舞弊识别成为对于上市公司监管的重要任务,有利于维护投资者利益和资本市场稳定。本文将研究目光放在年报文本上,将年报文本中的管理层讨论与分析文段作为研究对象,从多个角度对于年报文本中信息量含量较大的管理层讨论与分析文段进行文本特征提取,加入到舞弊模型中,查看文本特征对于舞弊识
学位