联邦学习场景下拜占庭攻击防御算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wwj88888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的飞速发展,神经网络模型变得越来越复杂,在单一数据集上进行模型训练往往难以满足需求,而统一收集各方用户数据上传到服务器进行集中训练则会造成隐私信息泄露。为了解决这个问题,近年来兴起的联邦学习技术可以在保护用户隐私数据的同时,实现分布式数据的联合学习,从而构建全局模型。然而,在联邦学习中由于服务器无法直接获取用户的本地训练数据对其进行检验,极易遭受来自恶意用户的攻击。基于此,首先提出了一种名为权重攻击的新型攻击方法,通过构造低质量局部模型可以绕过现有模型检测算法,使得联邦学习中聚合模型无法正常收敛并降低其准确度。通过与现有的拜占庭攻击方法标签翻转攻击和符号翻转攻击进行对比实验,结果表明即使是在简单的Multi-Krum算法和FABA算法的防御下,标签翻转攻击和符号翻转攻击的攻击效果都微乎其微。相比之下,权重攻击的攻击效果则十分明显,在这两种防御算法的保护下依然能使全局模型的准确率大幅度下降。其次提出了一种基于模型异常分数的防御方法,在无需获取用户数据以保护隐私的前提下,能精准识别低质量模型,有效抵抗权重攻击。在MNIST和CIFAR-10两个数据集上的实验结果表明,权重攻击对现有防御策略依然有效,能明显地影响聚合模型的收敛,大幅降低模型的准确度,同时提出的基于异常分数的防御方法可以有效地抵抗权重攻击。联邦学习以保护数据隐私为前提来实现分布式数据的共同训练,在此过程中拜占庭攻击是不可避免的。只有针对各种攻击提出相应的防御策略来减小甚至消除恶意模型的影响,才能让联邦学习更好地发挥其保护隐私和分布式训练的双赢效果。
其他文献
随着互联网的发展,企业的业务规模越来越庞大,企业内服务器数量逐步增多,服务器上部署的应用种类和数量也随之增多,如何高效地、可靠地管理这些服务器与应用是企业要面对的一个重要问题。基于此问题,设计出一个整合多种业务需求的IT运维管理平台。通过在运维管理平台中进行操作,就可以实现对线上服务器和应用运行状态进行监控以及对应用进行快速发布部署等功能,极大地提升了IT运维人员的工作效率。本系统基于某中小型企业
学位
计算机技术的发展,带来新的产业格局转变。其中康复医疗行业通过积极拥抱互联网行业,迎来新的发展契机。例如,近些年,基于虚拟现实技术研发的各类康复游戏,在市场中不断涌现。然而,大部分游戏仅针对患者的一个部位进行康复训练,导致患者需要在多套系统之间切换,患者的训练行为难以追踪,游戏训练数据分布零散且内在价值难以被挖掘等问题。针对目前康复游戏在用户行为追踪和游戏数据管理两方面的痛点,该研究以一组康复游戏产
学位
当今时代,随着互联网的普及和多媒体的发展,图像有了广泛的应用,图像的传输需求越来越高,图像在传输中的安全也越来越重要,所以对图像加密方面的研究愈显重要。PNG是重要的图像格式,PNG图像广泛应用于网络、软件和手机上,所以研究PNG图像的加密将有重要的意义。在数据量巨大的今天,传统的加密技术对称加密和非对称加密,它们都存在着一定的缺陷,可能未加密文件关键属性,密钥密文相关性不高,在计算机技术发展的过
学位
随着医疗影像技术的不断发展,正电子发射断层成像机(PET)设备所需要处理的数据量越来越大,对数据处理及可视化系统的需求越来越强。市面上大部分的可视化系统是对于PET重建数据的二维切片成像,对于重建之前的阶段如采集、符合则需要分阶段处理,无法做到完整过程上的实现。因此对于PET设备来说越来越需要一套集采集、符合、重建、校正及可视化于一体的软件系统。针对PET设备的软件需求,对PET的浓度数据及现有的
学位
文本匹配是自然语言处理领域基础任务之一,实现时往往需要较为复杂的文本交互的过程。论文针对这个实际问题,并结合文本匹配具体的任务场景,设计了一个基于BERT(Bidirectional Encoder Representation from Transformers)预训练模型和图神经网络模型混合的文本匹配算法,该算法可以简化复杂的文本交互的过程,达到一个较好的文本匹配的结果。论文借鉴了Senten
学位
近年来关于机器阅读理解(Machine Reading Comprehension,MRC)的研究持续火热,机器阅读理解任务可以看做是基于文本的问答系统,给定一段上下文和问题,机器得出答案。MRC任务衡量了机器理解人类自然语言的能力,并且在实际生活中具有很高的应用价值。多步推理机器阅读理解相比传统专注单篇文章的阅读理解方法,更加强调机器的推理能力,旨在要求系统结合多篇文档的多个推理事实进行推测,进
学位
近些年来,深度学习方法在图像识别任务上具有良好表现,但其良好表现往往依赖于大量的,数量均衡的样本数据。在现实生活中,不同类别的样本数据量往往呈现出一种长尾分布,当数据集中只存在少量的训练样本,如何更好的对测试图像进行识别,于是提出了小样本学习方法。基于图神经网络的小样本图像识别模型分为表示学习和度量学习两个阶段。在表示学习阶段,通过卷积神经网络将图像映射到特征空间中,获取图像的嵌入表示,但同类样本
学位
在大数据时代,企业每天都会产生海量的日志信息,这些信息里面包含着许多与企业产品相关的重要信息,而日志文件又散落于分布式集群环境中的各个节点上,这极大的增加了日志收集的难度。因此亟需一套海量日志分析系统来解决这些问题,该系统能通过大数据技术手段对这些散落于各个服务器上的海量的日志数据进行统一管理,从而分析提炼出有价值的信息。通过调研国内外日志分析系统的研究现状,结合企业中实际使用的日志分析系统的架构
学位
随着社会的发展和人口数量的增加,我国老年人口数量在逐年增加,患有各种慢性疾病待康复的老年人逐年增多。目前我国康复医疗资源紧缺,使用的大部分运动康复设备存在设计复杂、造价昂贵、使用不便等不足,已经不能满足大多数待康复患者接受充分康复训练的需求。因此,通过开发实现用于康复训练的嵌入式助步车系统可以更好地帮助病人进行行走康复训练并能提供实时数据反馈和监护,使训练过程更加科学合理。用于康复训练的嵌入式助步
学位
Kubernetes将容器视为服务,并提供自动重启、弹性伸缩等功能,是当前部署微服务的主流平台。但kubernetes集群调度在默认实现上是一种在静态资源上进行的机制,在对电商类实际应用场景进行架构部署时,仍然存在扩缩容上的冗余计算以及节点资源利用率不足等弊端,这很容易造成集群并发性能以及高可用性上的瓶颈。针对上述挑战,在借助Kubernetes作为微服务架构的部署框架的基础上,论文对传统电商微服
学位