基于重复博弈的联邦学习激励机制研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：my_code

【摘要】

：

【作者】

：

王文聪

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

联邦学习（Federated Learning）能够使用来自大规模节点的本地数据集进行分布式模型训练,由于联邦学习在解决“数据孤岛”问题和保护数据隐私方面具有巨大优势,近年来迅速成为安全机器学习领域的研究热点。联邦学习的成功离不开分布式节点的积极参与,而长期机制的目的在于增加系统中用户节点的粘性,确保用户能够长期参与到系统中来,因此针对联邦学习系统中长期机制的研究与设计必不可少。在本文中,我们针对跨设备联邦学习和跨组织联邦学习的不同特点分别设计了长期激励机制和长期合作机制。基于动态重复博弈的跨设备联邦学习长期激励机制。在跨设备联邦学习任务中,模型的训练和更新通常是长期的重复过程,因为移动设备（员工）和任务发布者之间的模型训练过程需要经过多轮重复迭代才能使全局模型达到良好精度。然而,移动设备通常会自私地节省其本地资源,即使在模型训练开始时部署有激励机制,也无法保证员工会诚实地参与完成所有轮次的训练,这种“搭便车”行为会导致全局模型最终表现不佳。在推动我们工作的现有文献中,很少考虑在跨设备联邦学习中实现长期激励。本文将多轮次的联邦学习过程建模为一个动态重复博弈,为了获得长期收益,我们采用通用的触发策略作为对“搭便车”的惩罚,并推导出重复博弈的子博弈精练纳什均衡。基于博弈理论分析,我们设计了一个由纳什均衡状态驱使的长期激励机制,该机制能够引导任务发布者选择最有效的工资,激励移动设备进行长期合作,并避免移动设备在联邦学习过程中途“搭便车”。通过仿真分析,表明了该方案的有效性。基于重复博弈的跨组织联邦学习长期合作机制。跨组织联邦学习能够让具有相同利益的组织在保持其本地数据隐私的情况下合作训练一个全局机器学习模型。良好的全局模型精度离不开许多组织的积极参与,并且由于组织的本地数据集通常是时变的,因此可能会重复执行多个联邦学习过程来使全局模型适应不断变化的本地数据集。然而,跨组织联邦学习的参与者旨在通过自私地选择他们的参与水平来优化他们的长期收益。在本文中,我们将跨组织联邦学习中异构组织的长期自私参与行为建模为一个无限时间范围内的重复博弈,其中单个时段组织的自私参与博弈构成了阶段博弈。对于阶段博弈,我们推导出唯一的纳什均衡,并表明在均衡状态下,可能存在为了节约自身成本而不进行本地模型训练的“搭便车”者,而“搭便车”者的存在对实现良好的全局模型和维持其他组织的长期参与都有着不利的影响。为了实现组织之间的长期积极合作,我们提出了一个长期合作机制,该机制能够在增加模型训练本地数据量的同时,最小化“搭便车”者的数量。长期合作策略在惩罚策略的强制下,构成了重复博弈的子博弈精练纳什均衡,在这种情况下,一部分阶段博弈纳什均衡中的“搭便车”者就会转变为部分数据贡献者。我们进一步提出了跨组织联邦学习最优合作参与策略的长期合作机制算法,该算法在最大限度地增加模型训练的本地数据量的同时,使“搭便车”者的数量最小。仿真结果表明,我们的方案具有有效性。

其他文献

以用户为中心的多因子认证协议研究

近年来,数字化在商业、医疗、娱乐等领域不断深入,各种在线数字平台不断涌现,人类社会已悄然进入了数字时代。随着数字平台的数量不断增长,数字信任问题也在迅速增长,用户面临的威胁日趋复杂。当前基于用户名和口令的认证协议已难以满足日益增长的安全需求。具体而言,用户选择不同口令登录不同平台,极大地增加了用户记忆负担;此外,口令认证安全性低,面临许多已知攻击。以用户为中心的多因子认证协议可解决上述问题,采用单

学位

基于自注意力长短期记忆网络的日志异常检测关键技术研究

日志作为记录系统实时运行状态和程序执行状况的数据,既是软件开发人员和运维人员监测系统运行状态重要资源,也是实现系统异常检测的绝佳数据源之一。当下基于深度学习的日志异常检测已经成为自动化系统异常检测研究领域的重点关注内容之一,但仍存在以下难题亟需解决:日志文本数据其中所包含的信息和特征很难直接作为输入被深度学习模型所学习,需要构建特定的日志解析方法;传统的日志异常检测模型仅适合特定系统,忽略了日志所

学位

基于中央凹视频压缩的监控视频移动目标关键帧压缩方法研究

随着信息技术的不断普及,实时监控技术在物联网中得到了广泛的应用。重要公共场所均安装了摄像头监控设备,这些场所更关注物体移动变化而非固定的场景画面。由于摄像头经常处于复杂干扰环境中,视频流的实时传输效果无法得到保障。当传输环境较差时,现有的自适应视频压缩方法通常会随机降低某些帧的分辨率,以保障视频的播放流畅。若被降分辨率的帧是含有移动物体的关键帧,则不能满足视频监控获取关键信息的要求。因此,为了提高

学位

结构化数据不平衡处理研究

越来越多的企业利用机器学习中的分类技术来分析各种商业数据,从中提取有价值的信息。这些商业数据中的大部分数据是正常类数据,少部分数据是异常类数据。大部分的商业数据都是不平衡的。因此,不平衡数据分类问题一直以来都是机器学习领域的一项重要研究课题。目前为止,不平衡数据分类方法主要分为数据层和算法层两个方面。本文分别基于数据层的数据合成思想和算法层的集成学习思想,提出了两种用于结构化数据不平衡处理的方法。

学位

益气活血消癥方对COPD成纤维细胞增殖和炎性因子表达影响的研究

研究背景:慢性阻塞性肺疾病作为一种常见的呼吸系统疾病,是一种可预防和治疗的疾病。近年来慢阻肺患病率逐渐上升,患者生活质量低、社会经济负担较重,成为全球关注的公共卫生问题。目前研究表明,COPD的发病机制主要有炎症反应、蛋白酶/抗蛋白酶失衡、氧化/抗氧化失衡等。COPD的特点是炎症因子、多种蛋白酶的水平提高,NF-κ B诱导多种炎性细胞分泌如集落刺激因子、白介素-6、肿瘤坏死因子-α、粘附分子等多种

学位

活动期溃疡性结肠炎寒热错杂证寒热偏盛的不同与肠道菌群的差异性研究

背景作为人类常见的消化系统疾病之一,是一种由多种因素引起,病因尚不明确的慢性非特异性炎症性肠病,目前导致溃疡性结肠炎的因素包括:肠道菌群失调、适应性免疫失常、环境和遗传等。溃疡性结肠炎反复迁延不愈在影响患者身体健康以及生活质量的同时,由于其反复发作导致溃疡性结肠炎相关性结直肠癌占溃疡性结肠炎患者死亡的9%-11%,因此溃疡性结肠炎被世界卫生组织列为现代难治病之一。人体肠道菌群的数量、组成和分布与肠

学位

面向攻击测试的虚拟机带外数据采集系统

随着信息化技术的日益更替,针对信息系统的恶意攻击愈来愈频繁。恶意攻击的对象已不仅局限于个人用户,攻击者的攻击目标逐渐深入到企业、政府等关键组织和机构,对金融、交通、通信、医疗等重要行业都造成大量损失,严重危害社会的稳定。为阻止攻击事件的发生,针对恶意攻击的测试和研究成为网络安全专业人员的关注重点。为更好的测试和研究攻击,采集恶意攻击产生的数据信息是非常有效的手段和必要的基础。然而,现存的数据采集系

学位

深度神经网络中的可溯源数字水印研究

近年来,人工智能飞速发展,正在以空前的广度和深度推动社会进步。作为当前人工智能技术的重要分支之一,深度神经网络被广泛应用于图像分类、语音识别、自然语言处理等领域,发挥了不可替代的作用。训练深度神经网络需要大量的训练数据、强大的计算能力、相关的专业知识和专业经验。因此,一个训练好的高性能深度神经网络具有很高的价值,通常被视作模型所有者的知识产权。模型所有者可以基于自己拥有的模型对外提供付费服务,也可

学位

P2P网络下的联邦学习全局模型训练方法研究

传统的集中式联邦学习系统依赖一个中央服务器来协调全局模型的训练过程。然而,集中式联邦学习的前提是所有客户端信任一个中央机构,一旦中央服务器出现单点故障,将导致系统崩溃和全局模型训练的失败。此外,系统中通常涉及大量的客户端,每个客户端与中央服务器进行直接通信和多轮次交互,这需要负担巨大的通信成本。因此,集中式联邦学习系统可能会出现单点故障和通信开销大的问题。事实上,在许多实际场景中的网络通常是点对点

学位

基于对抗降噪网络的图像对抗样本防御方法研究

近年来,随着计算机计算能力的显著提升和数据量的大幅度增长,以深度神经网络模型为基础的深度学习算法快速发展,广泛应用于计算机视觉、自然语言处理、智能控制等诸多领域,甚至引发了新一轮的工业革命。然而,随着对深度学习技术研究的深入,人们发现其很容易受到对抗样本的欺骗。所谓对抗样本,是指攻击者人为地在原本能够被正确推理的数据中,添加微小的甚至人类难以察觉的对抗性噪声,从而生成的恶意样本,它可以误导目标模型

学位

基于重复博弈的联邦学习激励机制研究

与本文相关的学术论文