基于联邦学习的信用卡风险评估研究

来源 :华南理工大学 | 被引量 : 1次 | 上传用户:shinemun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的进步和发展,银行金融业不再仅仅局限于向大型用户提供服务,面对私人的金融服务也逐渐成为重要业务,例如,向用户提供贷款和向用户推荐理财产品等。这些多样化的信用卡业务是银行的基础业务之一,它涵盖了信用卡的发放审批、信用贷款的审查和追缴等多个业务环节,关系到用户和银行双方的利益。因此,构建基于多方参与的信用卡风险评估模型,从而更加精准的刻画用户特征,进而规避用户风险,对银行业务来说是重中之重。然而由于道德、法律等多方面原因,一些数据提供方并不能暴露用户数据,使得数据无法流通,从而产生了“数据孤岛”问题。联邦学习(Federated Learning,FL)为隐私保护的信用卡风险评估问题提供了新解决方案,能在不暴露用户数据隐私的前提下,解决“数据孤岛”问题。但是,现有的联邦学习算法大多基于诚实参与方假设,即:联邦学习的参与方都会提供自身的真实数据。然而,在真实生产环境中不能忽视存在数据重复等问题的可能性。此时,则无法保证多参与方所提供数据的可用性。因此,为解决上述问题,本文在纵向联邦学习的框架内,提出了一种基于多视角学习和私有特征提取的信用卡风险评估模型FL-SIMV(Specific Information extraction And Multi-View Training For Vertical Federated Learning)。主要研究内容和成果如下:1)原始信用卡客户数据存在数据量大、信息杂乱等特点,本文通过特征工程技术对原始数据进行了清洗,随后使用数据可视化技术对数据进行预处理,从而减小数据的噪声,增加数据的光滑程度。2)针对多方参与的信用卡风险评估问题,本文改进了现有方法,提出了对多方数据进行共享空间挖掘和私有特征提取的联邦学习算法:本文将多视角学习与联邦学习相结合,将参与训练的数据分别输入不同的神经网络:其中一个网络进行共享子空间挖掘,得到低冗余和低噪声的共享特征表示;另一个网络进行私有特征提取。两个神经网络进行协同训练,以达到最优的用户特征表示。在该模型的训练过程中,被动参与方只需向主动参与方提供数据中间层信息,使得主动参与方无法获知确切用户信息,从而保证了客户数据的隐私安全。3)针对联邦学习中的数据可用性问题,本文在模型训练中通过数据正交化查找出重复数据,结合点积注意力机制提出了基于特征预测的数据生成方法:通过将已有数据输入点积注意力模型并最小化损失函数来生成缺失数据。并通过后续微调模型参数,来提高模型的精准度,使得模型能够学到更精准的信息,保证数据的可用性。4)为了验证模型的有效性,本文在多个公开信用卡数据集上进行了多组对比实验,实验结果表明,本文提出的模型能在保证数据安全的基础上,在相关指标获得更优的效果。综上所述,本文引入了联邦学习来解决信用卡风险评估问题中的“数据孤岛”难题,针对现有研究模型算法效果不足的问题使用子空间学习的思想来提高算法效果。面对引入联邦学习后带来的数据可用性问题,本文使用数据正交化和点积注意力机制,提出了基于特征预测的数据生成方法。同时本文还通过实验验证了本文提出的算法模型的有效性,为信用卡风险评估问题提供了一个新的解决方案。
其他文献
2013年《大气污染防治行动计划》发布以来,珠三角地区实施了严厉的大气污染防控政策,在全国率先实现PM2.5浓度达标。然而,已实施的控制措施带来的污染物与排放源变化、减排效果及减排对大气中PM2.5浓度改善的环境效益尚不清楚。因此,本研究建立了2013-2017年珠三角地区实际管控情景下的基准趋势排放清单和2013年污染控制政策水平下的基线情景趋势排放清单,基于基准清单和基线清单量化了主要控制措施
学位
多溴联苯醚(PBDEs)作为一种典型的持久性有机物(POPs),因其具有毒性、持久性和生物积累性,且易从产品迁移至环境介质中,对生态安全和人类健康构成严重危害。开发高效、绿色、经济的PBDEs降解技术显得尤为重要。近些年,基于硫酸根自由基(SO4·-)的高级氧化工艺(AOPs)发展迅速,被广泛应用于各类有机污染物的高效降解。本文针对PBDEs中毒性强、环境检出量高的2,2’,4,4’-四溴联苯醚(
学位
实现高氨氮废水的高效低碳脱氮一直是水处理领域追求的目标。与完全硝化反硝化工艺相比,部分亚硝化(PN)-厌氧氨氧化(ANAMMOX)工艺具有无需投加碳源、耗氧量低等优点,在高氨氮废水脱氮处理中具有广阔的应用前景。同时,部分公司希望组合脱氮工艺最好可在原有构筑物的基础上进行改造,形成具有连续进出水且操作相对简单、无需反冲洗等复杂操作特点的脱氮工艺。基于沸石的氨氮吸附特性和硝化微生物载体功能,本研究通过
学位
木版画作品中蕴藏的精神与中华民族、时代发展十分紧密地联系在一起。当下,木刻艺术家们在艺术创作理念、材料和表现形式等方面不断探索,推陈出新,赋予木刻版画在当代语境下新的审美意趣和精神内涵。在木刻版画艺术的传承、教学过程中,木刻刀具产品作为木刻版画制作过程中最主要使用的工具,刀具磨损更换成本高、刀柄不易持握、造成手部肌肉疲劳、操作性较高、使用时的安全系数较低等方面的弊病被不断放大。市面上售卖的木刻刀具
学位
在当前信息大爆炸的互联网时代背景下,人们的阅读形态和阅读方式发生了巨大的转变,由传统的纸质化阅读逐渐转为了电子化阅读,阅读也呈现出浅显、碎片化以及功利性的特点。高校图书馆作为学校的信息文献中心,承担着教导学生进行合理阅读的重任。但是,目前高校图书馆阅读服务存在的诸多问题严重阻碍了图书馆服务和教育功能的发挥。随着5G时代的到来,各行业智慧化建设逐步兴起,读者的阅读服务需求更加趋向多样化和个性化,因而
学位
手性哌啶类化合物是一类重要的含氮杂环化合物,被大量应用于临床和医药研发领域,因其广泛的生物活性受到了人们极大的关注。这些化合物的生物活性很大程度上取决于哌啶环上取代基的位置和立体化学构型,但是构建和制备这些手性结构或中间体十分具有挑战性,因此合成手性哌啶类化合物也是当前的研究重点之一。N-[(3R,6R)-6-甲基哌啶-3-基]氨基甲酸叔丁酯和(2S,5R)-2-甲基-5-氨基-1-苄基哌啶盐酸盐
学位
厨余垃圾产量大、含水率高,往往含有塑料、纸张等杂质。作为资源昆虫,黑水虻转化厨余垃圾可实现减量化、无害化、资源化。黑水虻养殖一般分为池养及盒养,现在针对黑水虻盒式养殖处理厨余垃圾的技术参数研究较少。微塑料是当前环境领域研究的热点,堆肥施用是土壤微塑料的重要来源,但黑水虻处理厨余垃圾及虫粪二次堆肥过程的微塑料却被忽略,在此过程中的微塑料的分布变化情况及潜在的污染问题亟待研究。基于此,本论文一方面调查
学位
二苯并七元环类化合物由于其特殊的三环结构,常作为新药研发的结构支架。在现有的药物中,有许多药物都是以二苯并七元环作为结构单元,结构不同的二苯并七元环类药物具有不同的生物活性。本文以新型抗流感病毒药物玛巴洛沙韦的重要中间体为先导化合物,设计合成了第一类二苯并硫杂卓酮类化合物,再对第一类化合物的结构进行改造,得到第二类二苯并环庚酮并噻吩类化合物,并设计了一条新的合成路线。最后将第二类化合物的羰基还原,
学位
在当前大数据时代,大数据被应用在各个领域,然而一个领域的发展往往离不开其他领域数据的支持,数据交易产业应运而生。企业或用户需要购买其他人的数据,和自己的数据一起,共同执行计算,如执行数据挖掘算法等。但是目前的数据交易平台存在隐私数据泄露的问题:数据交易平台或不诚实的数据买方在获得数据卖方的源数据之后,可能会将数据卖方的源数据转卖给其他人,损害数据卖方的利益。区块链作为一个具有防篡改,可追溯等特性的
学位
溃疡性结肠炎(Ulcerative colitis,UC)是一种发病于结肠部位的慢性炎症性肠病,属自身免疫性疾病。因其发病机制复杂,目前尚无满意治疗方法。源自《伤寒论》的经典方白头翁汤对UC疗效确切、副作用少,但相关基础研究匮乏,有效成分及机制均不清晰。本研究旨在探索白头翁汤及主要成分白头翁皂苷B4(Anemoside B4,AB4)抗UC的作用和机制。1.通过动物模型研究白头翁汤及其主要成分药效
学位