基于隐私保护的贷款违约模型挖掘研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:reeyung
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网金融、信用卡业务的崛起,贷款人违约现象逐渐增多,不良贷款也随之不断攀升,这些现象给发放贷款的金融机构造成一定的经济损失。有些金融机构为了降低不良贷款率,多家机构线下共享违约人黑名单,但这种共享方式有两大缺点,一是无法实时在线完成,二是无法保障贷款人和金融机构的隐私信息。因此,需要通过安全的方式对隐私内容进行保护,并建立违约模型对贷款人违约进行预测。本文研究内容针对聚类集成方法提出建立基于多方的违约模型。传统的隐私保护方法从安全角度出发,通过加密等算法对原始数据进行处理,而当参与计算的数据维度变高并且具有相关性时,现有的隐私保护方法无法起到保护作用。本文主要工作如下:第一、针对高维数据的降维和隐私数据的保护,课题选择FastMap投影作为高维数据的降维方法。由于FastM ap通过投影是对数据对象进行距离改化投影到低维空间,因此对参与多方计算的隐私数据进行了保护。第二、我们提出一种创新的聚类集成方法KMS将各方产生的基聚类结果合并,这样得到的聚类结果代表所有参与计算方数据的最终聚类,并且合并后的聚类结果比单个聚类结果更好。第三、采用多重共线性检验选择特征参与基于Logistic回归的违约模型,保证参与运算的特征对违约模型的构建起到显著作用,加强模型的解释性。第四、采用多重共线性检验进行特征选择,使用安全多方计算的半诚实模型作为基于FastMap和Logistic的贷款违约模型组合评估平台的基础,保护客户端隐私信息并建立高可靠的违约评估模型。为验证本文所提方法的性能及效果,我们通过三组合成集群数据对比试验,分析了 FastMap的性能,证明FastM ap能生成更好的组件数据集,并且在噪声数据上的效果良好。通过四组真实数据对三种共识函数对比试验,分别将基聚类进行集成,集成的结果与数据集中真实类标签进行比较,并使用四种评价方法对聚类集成效果进行比较。聚类集成的性能比简单的聚类算法效果更好,并且算法的性能随噪声特性的增加而逐渐减小,数据集中噪声越多,对数据进行聚类越困难。通过真实数据的对比试验,我们对聚类集成的效果进行评估,结果证明FastMap投影对数据隐私和数据转换有更好地效果,提高了高维数据聚类集成的性能。
其他文献
随着国内液晶显示器件行业的蓬勃发展,该类厂房中精密设备对周边使用环境要求越来越高。厂房内部温度、湿度、洁净度及微振动的细微改变,都会直接影响液晶面板生产的良品率,从而影响厂房生产效率。针对电子厂房中精密设备的微振动控制十分复杂,而对于一类自身即包含发振部件又包含精密部件的精密设备的微振动控制就更为复杂。本文研究的涂布设备即是此类设备,由于该设备自身工艺条件的限制,其内部发振部件与精密部件需安放在同
我国北方地区气候寒冷,冬季河流等水域发生冰冻现象,春季河冰融化后,大量冰排在水流推动下对河流中桥梁产生挤压和撞击,流凌在高寒地区产生的危害尤为严重。目前在桥梁工程中施工临时钢栈桥被广泛应用,其不仅作为承担材料和机械设备的运输通道,还承担着桥墩下部施工的平台任务。施工临时钢栈桥工作状态下活荷载大,而构件杆件细长、薄壁稳定性较差,冬季钢材在低温环境下易发生冷脆现象,材料的塑性和冲击韧性显著降低。因此对
振动问题一直是困扰风机制造行业的难题之一,它不仅对风机运转、环境(噪音)、安全产生重要影响,而且与风机的使用寿命有直接关系,随着风机逐渐向高速、高效、低噪、小型化发展,对风机的振动要求更高,这一问题更显突出。本论文以某公司生产的BL**-1风机振动故障为例,总结归纳常规通风机振动故障分析解决的经验,结合国内外通风机振动分析领域的最新进展,通过对风机叶轮、风机装配、电机/传动、风机结构、气流/风道五
大型汽轮发电机作为火电、核电等发电站中的重要发电设备,由汽轮机转轴驱动,用来将机械能转化为电能,向电网输送电力。汽轮发电机转子的作用,是在机组运行过程中,负责传递由汽轮机端提供的强大负载转矩,并把负载转矩转化为电能。转子工作转速高,由于转子旋转产生的离心力,对机组造成了非常大的机械应力作用,同时,运行中转子存在强大的磁场,发电机转子承受巨大的电磁力作用,转子容易发生因零部件疲劳导致的损坏、因短路引
呼兰河是黑龙江境内一条重要的中型河流,自炉吹山起,沿途经过伊春、绥化、哈尔滨,在张家店注入松花江。绥化地区呼兰河沿岸众多工业企业,城镇污水处理厂的污水均直接排入呼兰河流域,此外还有农村的生活污水以及农田径流的污染物排入其中。该区段地表水体水环境质量能否满足功能区的要求将极大的影响流域的经济发展与居民的生活质量。本文收集了呼兰河(绥化段)的四个国控断面2016-2019年的水质监测数据,以此进行水质
电饭煲经过多年的发展,从机械电饭煲发展到智能电饭煲,从热盘加热发展到电磁加热,均在加热控制上面做出了重大改进,但这些改进都没有解决需要用户参与煮饭的问题,可见目前的电饭煲不够自动化和人性化。调研发现,目前电饭煲的全自动技术,存在量米不精准、送米难实现、洗米易搅烂或者清洗不干净等缺陷,尚未有一套可行的全自动技术应用在小型电饭煲上。本文采用全套自动化技术进行定量取米、送米、洗米和配水,实现全自动烹饪,
近几年随着人们生活水平的日益提高以及家用电器的快速普及,人们对家用电器的各方面的要求是越来越高。空调系统作为给用户的生活空间调节气候的主要电器,其噪音的表现已经成为人们购买的重要衡量指标之一。旋转式压缩机是空调系统的核心零部件,旋转式压缩机的振动过大或者是噪音过大会导致空调系统的噪声大噪音值超标,影响人们使用空调系统的舒适度。本文对某型号的空调系统在终端市场上形成用户对产品噪声而反馈的问题进行了测
输电网络对于我国经济发展和人民生活有着重要的影响,统计数据表明,大部分输电塔结构的风致破坏是由下击暴流引起。下击暴流是起源于雷暴云的下冲气流冲击地面引起的短时强风,其风场特性与常见的良态风近地风场不同。国内输电塔结构设计规范并未对下击暴流风荷载进行规定,为提高输电塔结构安全性能,有必要探究下击暴流的独特风场特性,模拟输电塔结构在风场中的失效状态,为工程设计提供参考。本文基于数值模拟对下击暴流风场中
振动筛在物料筛分领域的应用越来越广泛,西安飞机制造有限公司经常使用振动筛对热处理的废弃物进行筛分,将能够二次使用的准废弃物重新利用,节约成本的同时提高能源的使用效率,但是在使用中设备经常会出现部分突发状况,例如筛分物超重,偏重,振动筛对地冲击过大,与厂房形成共振等等,因此关于振动机械的状态监测显得越来越重要。有效的监控系统能够实时监控振动筛的各项工作参数,能够及时发现机器的问题,提高生产率,降低振
目前,空调通过大风量、高流速来达到快速制冷制热效果,人经常处于此环境中,会产生熟知的“空调病”。部分用户为了满足更舒适的生活环境,购买一些其他厂家开发的相关配件,此类配件带来滴水、凝露等相关问题。为了解决此类问题,本文对送风风道系统作为研究的重要课题,实现超低风送风来满足更高的舒适性。概述了空气流与空调风道的相关理论,介绍了射流的基本概念、分类、分段、空气射流的参数计算方法以及送风口射流研究过程中