基于改进DenseNet-BC的信用风险预测研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:chenweifan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融市场化的大背景下,无论是新兴的互联网金融还是传统的线下金融机构都将信贷业务作为其经营的主要业务和利润来源。金融机构虽然可以从中获得相当可观的利润,但若无法对借款人的信用风险做出准确的预测,就会承担借款人违约所带来的各种风险。随着全球经济环境的不断变化和客户数据量的飞速增长,传统的信用风险预测模型已经不再适用于现在的客观现状,如何提高信用风险预测的精度、构建可靠的风险预测模型已成为工业界和学术界面临的重要问题。本文针对信用风险预测问题进行研究,提出了基于改进DenseNet-BC的信用风险预测模型。其主要工作内容如下:(1)现代经济数据集通常具有高维和不平衡的问题,导致信用风险预测模型的训练精度降低、鲁棒性差。针对上述问题,提出了一种融合Focal Loss的DenseNet-BC信用风险预测模型,该模型以DenseNet-BC为基础模型架构,在分类层引入Focal Loss损失函数,利用DenseNet-BC的密集连接特性,既有利于加深网络层数来增强对借款人特征信息的有效提取,又可以将浅层网络与深层网络的重要特征信息进行有效结合。同时,Focal Loss函数通过权重对样本间的类别不平衡和难易样本间的数量不平衡进行调节,减少了多比例类别样本和易分类样本对模型预测造成的误差,提高了模型的泛化性。(2)针对融合Focal Loss的DenseNet-BC算法模型中,因离散型特征经哑变量化后形成的高维稀疏矩阵以及深度神经网络模型训练过程中学习率对训练结果的影响,进一步提出融合自编码器与静态重启SGD的DenseNet-BC信用风险预测模型。对哑变量处理后的高维离散型特征向量,通过自编码器进行特征提取,然后将提取后的离散型特征向量与预处理后的连续型特征向量合并一起作为改进的DenseNet-BC算法模型的输入,同时在模型训练过程中使用静态重启SGD。该算法可以有效保证在减少计算量和内存损耗的情况下获得更好的特征表示,同时静态重启SGD可以使模型在训练过程中对学习速率进行自适应更新,使学习率不易受初始学习率大小的影响,避免模型在训练过程中因学习率过小而陷入局部最优,或因学习率过大而错过全局最优,从而提高算法模型预测的准确率。本文算法基于Lending Club公开的信用风险预测数据集,与多种传统算法及DenseNet-BC进行对比实验,实验结果表明本文算法具有一定的优势。
其他文献
近年来,随着互联网技术的高速发展,企业市场环境瞬息万变,企业面临一个更加复杂多变的生存环境。企业要保持持续发展,必须客观分析企业面临的内外部环境,有效整合企业内外部
污泥是污水处理过程中生成的副产物,是一种有害物质,如果这些污泥不能得到合理的处置,不但浪费了资源,并且会导致严重的环境污染。一般处置方式有:填埋、高温焚烧、农田利用等,这些方式不能从根本上解决污泥带来的危害,并且易对周围环境产生不利的消极影响,存在较大的弊端。近几年来,对于减少污泥产量、消除污泥对环境的潜在危害、将污泥进行资源化再利用等研究已成为环境保护领域关注的热点。本文将市政污泥和废弃泡沫塑料
学位
细胞自噬和凋亡是细胞生命历程中的两个非常重要的反应机制,它们的运转方式受到精致调控.研究表明,网络路径的重叠和复杂精密的调节存在于细胞自噬和细胞凋亡中,且这两者反应
由于环境污染日益严重,空气中的颗粒物、硫氧化物、重金属物都是引起人体肺部疾病的元凶。肺癌现在是世界上最常见的恶性肿瘤之一,对肺癌采取早期诊断和治疗是提高患者生存率并且减轻医疗负担的关键。随着人工智能的发展,利用机器学习算法对肺结节进行检测是人工智能医疗器械发展的热点方向,它可以显著改善医生分析医学图像的质量和效率。算法训练和产品测试所使用的数据集对于整个生命周期的品质管理和风险管理非常重要。来自单
学位
随着工业化的快速发展,工业源排放的VOCs总量也在持续增长,“十四五”将其设为改善指标之一。微波无极紫外降解处理VOCs操作简单无新污染物产生等优点,但处置过程中产生的臭氧问题引起广泛重视。本课题利用High Frequency Structure Simula-tor(HFSS)、Computational Fluid Dynamics(CFD)等数值模拟软件模拟微波无极紫外发生装置内电场及紫外
学位
知识管理,特别是知识共享管理在这个知识经济时代,受到越来越多的关注与研究。知识已经成为全球生产力与世界经济增长的驱动力,对于企业而言也是一样,是企业增长的动力。企业
改革开放以来,中国经济社会发展取得了举世瞩目的成就,但以要素驱动和投资驱动为特征的数量型经济增长模式在推动中国经济快速发展的同时,经济发展中低端供给过剩、高端供给
在能源短缺与环境污染的时代背景下,热电发电技术作为一种重要的节能减排手段已经成为人们关注的重点,在多个领域中已有示范性应用。在热电技术应用的众多领域中,以汽车尾气废热回收利用为代表废热回收利用领域和以光伏-热电耦合为代表的新能源领域,普及范围较广、研究程度较深,具有较强的代表性。但由于热电材料性能优值较低,热电器件结构不够理想等原因,热电发电技术在实际应用中未能发挥最大效能。通过优化热电系统中冷热
学位
在高维大数据中,多样性、异质性是数据的基本特征。数据信号弱、噪声大等因素常常使得模型分析效果欠佳。在实际数据分析中,数据本身的内在结构信息可以做为很有效的辅助信息
本文设计了一款能检测、识别两种挥发性有机化合物(VOC)气体(乙醇、丙酮)的多气体检测仪器。根据仪器的设计要求,本文选择了三种金属氧化物(MOS)气体传感器,由于MOS传感器的阻值变化范围较大,研究并设计了一种测量档位自动切换的大范围检测的接口电路,可通过调节电路档位实现与多种MOS传感器连接,微处理器采用ATmega16实现系统的控制以及数据处理与传输,传感器信号采集电路中使用24位模数转换芯片