基于贝叶斯网络的信用缺失数据填补模型研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:shiqiuqiu100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着金融领域逐步放宽民间资本的准入门槛,各类线上线下贷款机构迅速发展,信贷市场规模日益增大,带动了信用服务市场规模稳定增长,激发了各类金融机构对信用评估模型的开发需求。信用评估模型的性能高度依赖于原始数据的质量,但现实中信用数据的缺失问题却是无法避免的,这大大降低了信用评估模型的有效性和准确性。在实际中,大多数信用模型通过直接删除缺失样本或者用简单的均值,众数值填补的方法来解决这个问题,但是这些方法都会造成巨大的信息损失或者偏差。为了给信用评估中的数据缺失问题提供一种新的填补思路,提高信用评估模型的准确性与可用性,本文提出了一个新的缺失数据填补模型,即基于贝叶斯网络的迭代填补模型。该模型由两个阶段构成:准备阶段和填补阶段。准备阶段的主要任务是基于完整数据集训练贝叶斯网络。训练之后,模型及参数库就会将描述各变量之间依赖关系的结构网络以及每个变量的条件概率分布参数值储存起来。第二阶段是填补阶段,完成多变量迭代填补任务。在EM算法交替迭代使得似然函数递增求最优参数思想的启发下,模型以后验概率递增作为主要思想进行迭代,利用准备阶段生成的贝叶斯网络,依次对缺失变量的值进行更新。理论证明,该模型的主算法具有单调收敛性。与其他经典缺失值填补方法相比,本文方法的优势在于,利用了变量之间的概率依赖关系来估计缺失值,无需对概率分布作出前提假设,既适用于离散型变量也适用于连续型,既适用于单变量填补,也适用于多变量填补。为了验证本文提出的填补模型在信用评估缺失数据填补方面的有效性,本文以UCI数据库中两个著名的信用评估建模基准数据集以及人人贷平台真实信贷交易数据作为实验数据展开了对比实验。实验结果表明,无论是填补准确性还是填补之后信用评估模型性能,采用本文模型填补的结果都优于众数填补法和EM填补法这两个经典缺失值填补方法。
其他文献
大叶相思是亚热带速生树种,有固氮作用,能耐强酸。本研究以一年生大叶相思实生苗为材料,探讨大叶相思在强酸胁迫下抗氧化酶系统调控的生理机制。试验采用水培法,设置了p H 2.
竹具有生长迅速、生产周期短、难开花等特点,竹子有着重要的经济价值和广阔的开发应用前景。慈竹属于禾本科竹亚科慈竹属,为地下茎合轴丛生型,其生物量大、纤维素含量高,具有重要的经济价值。蔗糖合酶(SUS,EC 2.4.1.13)在植物中被广泛认为是一种具有调节碳汇强度、纤维素生物合成、碳分配以及响应植物逆境胁迫等功能的多功能蛋白。然而,有关SUS在竹纤维发育以及在逆境胁迫过程中的遗传证据尚有不足。在此,
随着城市化和工业化发展,工业土壤中重金属、多氯联苯、邻苯二甲酸酯类含量也越来越高,严重危害着区域生态环境质量与居民身体健康。目前,我国已全面开展大城市及特大城市地
含能自修复粘接聚合物可以作为一种新型粘合剂,应用于火箭推进剂和炸药中。含能自修复粘接聚合物中含有不饱和双键和大量的氢键,可实现在室温条件下被腈氧化物固化剂固化和自
在智能交通系统(Intelligent Transport System,ITS)中,VANET(Vehicular Network,VANET)是支撑ITS信息传递的主要途径。VANET通过无线终端、传感器等设备实现车辆的信息传递。车辆可以与道路辅助通信设施建立通信,车辆间也可以用无线通信的方式直接通信。VANET高效和安全的数据传输,是ITS系统搭建的基础。在未来ITS系统中车辆可以任何时间,
通过迈克尔加成反应来构建碳键、碳-杂原子键是一种经典、高效的方法。硫-迈克尔加成(Sulfa-Micheal addition,SMA)是构建碳-硫键最有效的方法之一。环状化合物是一大类常见的有机化合物,构建环状化合物的方法多种多样,而利用迈克尔加成是构建环状化合物的重要方法之一。硫-迈克尔加成引发的串联反应构建环状化合物有多种类型,目前已有大量的报道。氰醇类化合物及其衍生物是一种非常重要的有机合
本文利用NOAA逐日海表温度和ECMWF的大气环流再分析资料,探讨了赤道太平洋高低频纬向环流的差异及其可能的物理机制,并研究了赤道太平洋高低频纬向环流对应的大尺度环流异常
近年来,我国物流行业进入高速发展期,市场竞争日益激烈。A公司是一家国内知名的物流企业,主要在全国范围内经营零担业务和快递业务,而青岛地区是A公司的重点发展区域。经过实
汽车缺陷将对消费者、企业乃至社会带来不同程度的影响,轻微缺陷将影响车主的使用;严重缺陷将给消费者和企业带来人身伤害和大量的财产损失,同时带来严重的社会后果。这也使相关管理部门、企业越来越重视汽车缺陷产品管理,力求在发现缺陷后及时召回,减少因缺陷带来的损失和社会影响。缺陷汽车产品召回典型事件如“高田气囊召回事件”、“上汽通用断轴门召回事件”等。从2013年至2017年,我国缺陷汽车产品召回次数呈逐年
钳型(Pincer)配体一经发布便因其优秀的稳定的化学结构而引起了化学界极大的关注,并吸引众多科研工作者的研究与开发。现如今有关Rh,Ir和其他过渡金属钳形配合物都得到了广泛的研究,而与之相反,钴钳型配位化合物的研究却一直较少。为此我们基于NCN Pincer配体合成了三类共10种Co金属配合物,探讨Co金属配合物的性质。于本文第二章中,主要介绍了一些表征手段与实验准备。而于第三章开始阐述三类Co