隐私保护的联邦学习关键技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kelu1fu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字经济的到来加速了信息一体化的建设进程。联邦学习作为有效的分布式数据挖掘技术被广泛应用于大数据服务中。然而,产生大数据资源的云计算、边缘计算、物联网以及工业控制系统等多种复杂系统具有分散性、开放性、移动性、多安全性、异质性等特点,使得与之伴生的联邦学习技术面临着新的数据安全性和服务质量的双重挑战。为了实现高效安全的大数据服务,提升当前联邦学习中的隐私性、模型可验证性、模型完整性和模型可用性,本文亟需解决围绕联邦学习的隐私泄露、隐私计算开销沉重、聚合结果无法验证、恶意攻击以及数据不均匀分布等关键问题,主要工作和贡献可概括如下:(1)研究轻量级的隐私保护联邦学习框架。大数据分布环境中联邦学习训练过程承载数据隐私,并且训练参数的泄露也会造成信息泄露。针对现有典型隐私保护联邦学习系统在安全性和效率性方面的缺陷与不足,研究分布式环境下大规模密文存储开销大、密文数据挖掘计算负荷重、单一密钥安全泄露的问题。因此,本文提出一种轻量级的隐私保护联邦学习方案,设计XGBoost模型的联邦学习训练算法,构建基于多密钥结构的安全聚合机制,并将部分密文计算过程迁移至本地明文,确保模型分享和聚合过程的高效性和隐私性。实验表明隐私保护训练过程满足轻量级的需求。与现有隐私保护方案相比,训练时间提升多个数量级。(2)研究面向异质数据的无偏隐私保护联邦学习框架。广域大数据的复杂结构使得在不同域间异质数据(非独立同分布,Non-IID)分布偏差较大。为此,本文提出面向异质数据的隐私保护联邦学习,基于生成式网络设计隐私保护的数据增强机制,解决现有Non-IID数据分布下的联邦学习模型更新存在局部偏差、模型精度损失大,收敛速度慢等问题。实验结果表明所该方案可以应用于现有的多种典型联邦学习方案中,在多种Non-IID数据场景下对联邦学习的性能有显著提升,能够提升约70%的收敛速度,满足Non-IID数据处理过程快速收敛训练和高精度需求。(3)研究可验证隐私保护联邦学习方案。联邦学习通常在存储小样本数据的用户间协作训练,而用户间未建立信任机制。联邦学习的隐私计算通常在不可信的环境下执行,存在不诚实计算(主动攻击)的可能。为了防止恶意计算,本文提出支持主动安全的可验证隐私保护联邦学习机制,设计支持主动安全的可验证隐私计算方法,构建安全可验证的聚合机制,用以实现在联邦学习中对中间参数和训练结果的验证。基于实际数据集的实验表明该方案由可验证机制引入的开销在实际场景中是可接受的。(4)研究防御安全的联邦学习机制。现有攻击者利用联邦学习自身漏洞发起模型投毒攻击破坏模型完整性。联邦学习的隐私保护机制为模型投毒提供了隐蔽性,使得攻击难以被察觉和识别。为此本文提出一种具有抗模型投毒攻击的隐私保护联邦学习方案,在加密的参数上基于隐私保护的余弦相似度机制识别恶意参数以抵御攻击,确保模型的可用性,且基于隐私计算的防御过程不泄露敏感信息。基于实际数据集的实验表明该方案能够抵御多种典型的模型投毒攻击,具有强鲁棒性。
其他文献
作为典型的第三代半导体材料,GaN的功率密度是Si和Ga As的10-30倍,由GaN材料制备的功率器件被誉为理想的大功率微波器件。GaN基微波功率器件在雷达、5G通信、航空航天等领域不断展现出重大的发展和应用意义,随着GaN基微波功率器件的不断发展,向更高的输出功率和频率提出了要求。同时,为了更高的集成度,器件的尺寸也要减小。然而,随着尺寸的小型化和功率的增加,器件的可靠性和稳定性受到了极大的挑
学位
随着科学技术的进步,红外成像技术的应用场景越发广阔,其应用范围由军事领域逐渐扩大到工业、商业和民用等领域。近年来,作为红外焦平面的关键组件之一,读出电路(Read Out Integrated Circiut,ROIC)的发展成为许多领域的重点关注问题,如何研究出性能优越、匹配性良好的红外读出电路成为红外图像传感器的发展热点之一。目前读出电路的发展方向主要有大面积、小像元、低功耗、高速读出、高动态
学位
政府舆情指一定社会空间内,民众对政府发出规定、举措和倡议等表现的态度取向。随着互联网普及率的提高,以及网民规模的迅速增加,互联网已经成为最大的文本信息库。在事件发生、发展和变化时,大量网民和媒体会积极发表自己的观点,十分容易形成网络舆情事件。如果没能对负面舆情评论做出准确的分析,任由其发酵,很可能引起不良公众事件,损害政府公信力。如何对政府舆情评论进行情感倾向分析,及时对负面舆情进行控制,已经成为
学位
区块链作为一种国家战略性前沿技术,是分布式去信任环境下信任建立、数据交互、价值传递的核心。行业级联盟链是我国重点发展的区块链服务平台和应用方案,被广泛应用于数字金融、能源市场、电子政务、供应链等重点行业。现有联盟链系统部署拜占庭容错类共识协议只能实现少量分布式节点下的状态一致性,利用哈希函数和时间戳技术实现时序链式区块存储,并利用异构的底层技术(例如共识协议和加密算法)实现系统内部强安全保障和系统
学位
无线能量传输(WPT)系统作为一种新型的供电方式,突破了传统传输线的限制,能够解决复杂场景的供电问题,并且能够为IOT时代下数以亿计的传感器节点提供更加清洁和成本低廉的能源,成为研究的热点。随着整流天线技术的发展,中高输入功率场景下工作的WPT系统效率得到大幅的提升,然而在低输入功率工作场景下的WPT系统受到核心整流器件的限制,效率提升甚微。有鉴于此,本课题以提升2.45 GHz工作频率下的低输入
学位
利用阿秒激光技术开展的泵浦-探测实验帮助人们打开了原子分子内部电子超快动力学研究的大门,而飞秒激光是进入阿秒科学领域的必要工具。当今蓬勃发展的脉冲压缩技术助力飞秒激光的参数不断突破极限,其中的超连续光谱产生技术打破了激光增益介质本身以及放大过程带来的带宽限制,强大的色散管理技术已经能够使得飞秒激光脉冲突破光学周期的限制。空芯光纤以及固体薄片组展宽的方案可以产生毫焦量级超连续光谱,目前均可作为阿秒脉
学位
随着新课程改革的深入发展,生物教学被要求紧跟时代发展步伐,推陈出新,在课程中融入新的教学模式,不断丰富教学方法,在这一过程中运用概念图成为了生物教学发展的必然趋势。概念图能将新旧知识点整合成一个完整的知识体系,提升学生的学习积极性,培养他们自主学习能力和独立思考意识,有效提高学生的认知水平,为进一步提升生物课堂效率打下坚实的基础。文章简述了概念图的定义与运用作用,结合实例证明了概念图对于提高学生认
期刊
生产力水平是国家经济增长的重要驱动因素,而制造自动化是提高生产力水平的关键与核心技术,使得可用更少的资源,如原材料、设备和劳动力,生产更多的高技术产品。从技术上说,现代自动制造系统是一种资源分配系统,其子进程往往需要竞争有限的可重用资源以并发执行不同加工任务,因而自动制造系统中需要优化配置和共享这些有限资源。若没有有效鲁棒的控制策略来处理系统中可能出现的死锁和阻塞等情况,就无法达到最优的资源配置。
学位
宽禁带氧化物半导体是一种集导电性和光学透明性于一身的独特材料,被广泛应用在电子器件和光电器件,例如:薄膜晶体管、气体传感器、日盲探测器、太阳能电池、发光二极管和透明电子器件等众多领域。目前,氧化物薄膜晶体管主要应用在平板显示器的像素开关、驱动器以及透明电子电路等方面。在其众多材料制备方法中,溶液法是一种制备金属氧化物薄膜晶体管的很有前途的制造技术,因为它具有高产出、低成本,组分可控,操作简单,环境
学位
机器学习是人工智能的核心技术,已经应用于现代社会各行各业。机器学习算法的执行需要消耗大量计算和存储资源,通常需要借助强大的云平台才能实现各种复杂的机器学习任务。为了解决本地数据资源不足导致机器学习算法效果不佳的问题,用户通常选择将数据外包至云平台进行联合处理。用户上传的数据可能包含医疗信息、地理位置、金融记录等敏感信息,将数据外包给云平台剥夺了用户对数据的控制权,进而导致了一系列的数据安全威胁与隐
学位