联邦学习和SHAP及其在大数据风控中的应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:soy_chen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,数据已经成为制约机器学习模型发展的重要因素,如何安全便捷地联合多家企业数据进行建立模型从而得到表现更加优秀的模型成为一个重要课题。联邦学习着力于各方企业仅在交换某些模型训练时的加密参数的情况下,使用多方数据建立模型,从而打破数据孤岛提升模型性能。随着机器学习模型要处理的数据量越来越大,仅仅使用简单的机器学习模型难以充分发挥数据量极大的优势。随着复杂机器学习模型在大数据领域的广泛应用,人们越来越难以理解机器学习模型预测的过程,机器学习模型的解释成为一个重要课题。联邦学习下的机器学习模型的解释,不仅可以帮助人们理解模型的预测过程,而且有可能在一定程度上反映各方企业的数据价值。本文提出了联邦学习环境下的XGBoost算法的模型解释方法,可以对每一条样本的预测作出一定程度的解释,从而方便理解每一个特征在模型预测中起到的作用。在实证部分,使用Lending Club的信用贷款数据进行数据的预处理得到了十个入模特征,将十个特征分配到两方以模拟两方企业在联邦学习环境下的建模,并将联邦学习构建的模型和仅仅使用其中一方的数据和标签构建的模型以及直接将两方数据合并到一起而构建的模型相比较,最终发现联邦学习下构建的模型和直接将两方数据集中到一起构建的模型在表现上几乎无异且优于仅使用一方数据和标签构建的模型,并通过对联邦学习下模型的解释得到了在本次实证分析中对模型预测结果最重要的特征。
其他文献
学位
计算流体力学(Computational Fluid Dynamics,CFD)是一门使用计算机技术来研究数学、流体力学的交叉学科,液滴运动变形数值模拟是计算流体力学仿真模拟的重要应用领域。在不同流场的相互作用下,液滴形态在计算机中的描述与跟踪具有较高的时间复杂度,亟需利用加速器实现高效的并行模拟计算。深度计算单元(Deep Compute Unit,DCU)是我国自主研发的类GPU(Graphi
学位
本文研究了两类不确定非线性系统的自适应神经网络容错控制问题,根据故障引起的系统状态参数变化间接获取故障信息,进而自动调节系统参数和控制输入,并保证系统稳定性.由于神经网络对非线性函数具有良好的逼近性能,故选用径向基函数神经网络逼近系统中的未知非线性动力学函数.首先,研究了切换随机系统中发生执行器故障(包括失效和偏置故障)的控制问题,在任意切换信号下选取共同李雅普诺夫函数分析系统的稳定性,利用It(
学位
传统液态锂离子电池由于使用的有机电解液存在易燃和泄露等安全问题从而限制了其大规模应用。而全固态锂电池采用固态电解质取代液态锂离子电池中的有机电解液和隔膜,可以从根本上解决上述问题。此外,固态电解质能够与金属锂搭配组装为高能量密度的全固态锂电池,有希望成为下一代能量存储体系。目前研究广泛的固态电解质体系中,卤化物固态电解质相比氧化物和硫化物固态电解质,具有以下优势:(1)卤素离子对锂离子的弱静电引力
学位
储层计算(Reservoir computing,RC)是一种利用非线性动力系统作为储层实现信息处理的新技术.它起源于递归神经网络(Recurrent neural networks,RNNs),通过改进训练算法,避免了递归神经网络训练困难的缺点,具有处理速度快、计算容量大、物理实现简单等优点.一般储层的动态越丰富,系统性能越优异,非线性逼近能力就越强,精确度就越高.为了实现系统优异的性能,研究系
学位
云雨系统是研究降雨形成的重要模型,研究其复杂动力学可助于揭示降雨中的复杂现象与机理,对于气象学及人类的生产生活有重要意义.在国家自然科学基金(编号:11972327和11372282)的资助下,本文主要研究了具有雨产生时滞的Koren-Feingold云雨系统及其改进系统的双Hopf分岔、稳定性和复杂动力学.Koren-Feingold云雨系统作为气溶胶-云-降水相互作用的一个基本模型,首先由Ko
学位
学位
风险控制(简称风控)是指对用户风险进行管理和规避,是信贷管理领域的重要内容之一。智能风控以大数据算法为基础,以风控模型为技术手段,为欺诈检测、授信审批、贷后管理等环节提供决策分析和方案支持。本文基于级联思想构建智能风控模型,此模型采用了三个级联层和一个预测器,每个级联层有三个估计器(XGBoost、Light GBM和Cat Boost)。级联结构的设计既保留了原始特征的信息,又增加了估计器的预测
学位
学位
面对新冠肺炎疫情的不断蔓延,国内外经济都受到了影响.我国迅速采取了积极的经济调控政策,以此在宏观上保持经济正增长以及在微观上帮助企业实现复工复产.在此背景下,我们研究了一个宏观上的具有税收和决策时滞的财政动力学模型和一个微观上的具有生产时滞的古诺双寡头模型.我们研究了时滞对这两个系统的动力学行为的影响,发现了双Hopf分岔与复杂的动力学行为,从而可以控制时滞的范围,使系统维持在一个稳定的状态,进而
学位