多臂老虎机算法在联邦学习客户机选择问题中的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zzdlily_8000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联邦学习(FL)作为一种保护隐私的分布式机器学习,在智慧医疗,金融分析等领域有广泛的应用前景。联邦学习被广泛部署于边缘应用场景,致力于在保证隐私安全的前提下充分挖掘边缘设备中的数据和计算价值。然而,由于边缘场景的复杂性(如设备异构性,物理宽带限制等),联邦学习技术还远远未成熟,仍存在巨大的可优化空间。特别地,如何在联邦学习训练中对进行客户机选择是一个研究切入点。鉴于其部署环境中的物理带宽限制,在每轮的联邦学习训练中,只有一部分的客户机能被选择并参与到训练中。在并行数量受到约束的情况下,如何对客户机进行选择会对训练的效率以及训练的表现造成显著的影响。考虑到联邦学习系统的异构组成,当前在FL中被广泛采用的随机客户机选择策略仍存在巨大优化空间。具体来说,由于联邦学习边缘应用中设备的计算,通信能力,在每轮FL训练中对客户机进行随机选择可能会拉慢训练的效率,造成训练低效性并产生额外的训练开销。综合系统异构性和客户机中所存储数据的数值异构性,本文将研究在经典和不稳定边缘场景中的客户机选择问题,具体如下:1)在本文的第一个工作中,我们给出了客户机选择问题在经典边缘场景下的问题建模,算法求解和实验分析。研究发现,当客户机存在异构的计算与通信性能时,有偏差地一些高性能的客户机能一定程度加快训练,从而提升训练效率,然而,过多的选择偏差易造成训练模型对一部分客户机中的数据过拟合,造成训练效果的损失。基于该观察,我们提出了一种基于上确信界(UCB)的确定性多臂老虎机算法来对训练时间和训练效果进行折中。研究结果表明,我们提出的算法最高能减少40%的训练时间以达到同样的训练精度。2)在本文的第二个工作中,我们考虑了不稳定边缘场景下的联邦学习优化问题。具体来说,我们松弛化了在经典联邦学习中的稳定性假设—-客户机一定能在有限的时间内返回更新后的模型参数。基于松弛化的假设,我们提出了有时限的联邦学习聚合方案,并在此之下研究客户机选择问题对训练效率和性能的影响。为了对有效参与和公平性进行折中,我们提出了一种基于EXP3的随机性多臂老虎机算法进行客户机选择。研究结果表明,我们提出的算法能在保证选择公平性下有效提高有效参与从而提升模型收敛速度。
其他文献
随着航空工业的迅速发展,聚合物材料的应用范围一直在增加,其中环氧树脂(EP)因具有优异的粘结性、力学性能、绝缘性和耐化学腐蚀性,被广泛应用于航空器的结构材料和复合材料的基体。此外,锂离子电池(LIBs)被列为民航危险品运输的关键一项,而隔膜作为LIBs的重要组分之一,在为防止电池正负极短路和为锂离子传输提供通道起到关键作用。但是,EP和LIBs隔膜本质上是由C、H和O三种元素构成的聚合物材料,故一
学位
视频目标分割是通过用户指定或根据视频特征,在视频中分割出目标物体的一类视频处理技术。其对于视频编辑、推荐、搜索起到支持的作用,具有重要的研究价值。而当前不同的视频目标分割任务分别存在以下问题:通过对每个视频先标注出目标物体去分割指定目标的方法无法跨视频自动化处理、通过运动等信息可以跨视频分割出物体的方法又无法做到语义指定的分割。本文从兼容跨视频处理和语义指定分割的角度出发,对少样本视频目标分割进行
学位
信息高速发展的今天,每时每刻都会产生大量的数据,对大数据进行分析处理能够带来明显的经济、学术价值。分类一直以来都是大数据处理中比较常见的手段,同时分类问题也是机器学习中比较重要的一类问题。然而,很多分类方法都基于一个前提:数据在不同类别上的分布是均衡的,不同类别的样本被分错的代价也是相同的,这显然不符合现实情况。在数据分析的实际操作中,数据集的不平衡是一个不可避免的问题。如何在不平衡数据集上分类是
学位
当前我国民航安全形势总体良好,但仍然存在人员疲劳问题,对民航安全造成隐患。为进一步实现新形势下安全风险科学化管理,特别是对于飞行、空管等关键岗位人员,做好疲劳风险管理并保持良好的注意绩效水平至关重要。本研究从注意绩效入手,以个体内/外源警觉度的本质以及注意绩效影响机理为切入点来研究不同情境下唤醒水平对注意绩效的影响。首先通过查阅大量资料了解国内外研究现状提出论文研究目的和意义,并确定研究内容;其次
学位
随着虚拟现实技术的发展,构建真实的人体数字模型在从数字娱乐到教育培训等许多应用中都发挥着重要作用。人体因形状或姿态的不同而呈现出不同的外形,人体数字化的挑战之一是对人体形状和姿态的准确表示。本文对具有相同连接关系的人体网格集合的形状与姿态解耦表示模型开展了深入研究。受到3D网格卷积神经网络和解耦表示学习最新进展的启发,本文提出一个支持局部编辑的形状与姿态解耦网格自动编码器,该模型能够以无监督学习的
学位
在国家双循环新发展格局政策引导下,我国航空货运迎来了重大变革期。然而,目前机场空侧货运区作业能力无法满足实际运行需要的货运发展瓶颈已逐渐凸显。为延伸空侧货运区资源,最大程度优化资源配置,航空货物短途驳运应运而生。但由于航空货物短途驳运属于航空货物运输的一个环节,且涉及人员较多、操作流程较为复杂,各个环节都存在着潜在的风险因素,若未对其进行有效地控制,将对航空货物运输造成不可估量的后果。因此,对航空
学位
单幅图像去雨任务的一个关键挑战是在完全去除雨痕的同时仍然保留准确的图像细节。由于雨痕和背景场景细节之间的固有重叠与相似,在消除雨痕的时候,纹理细节会不可避免地丢失,这使得图像去雨任务的两个目的相互矛盾。现有的基于深度学习的方法试图在一个级联框架中同时解决这两个问题,或者将它们作为平行结构中的两个独立任务分别解决。然而,没有一个现有的方法能探索雨水分布与隐藏特征响应之间的联系与作用。使用雨水分布对隐
学位
在飞机的起降阶段极易发生突发事件,无论是自然灾害、技术事故、还是社会事件,都会对机场运行造成一定的影响。这些事件发生的概率和强度都很难预测和控制,但可以从机场运行系统本身的角度,提升自己抵抗突发事件不利影响的能力,降低机场的运行脆弱性。本研究在机场面临的众多干扰中选取跑道安全事件为干扰因子,基于脆弱性概念和VSD模型,结合其他研究中脆弱性指标设计思路,确定了暴露程度、敏感性、适应能力3个方面的一级
学位
随着近年民航业的迅速发展,航班业务量的大幅增加,机场为满足运行需求均在进行大幅扩建和在建,同时支线机场的数量也在大幅增加,仅在2020年,整个行业全年新建和更新114个新机场场,增加4条跑道,377个停车区和179.8万平方米的终端空间。到2020年年底,全行业的运输机场将有265条跑道、6621个停机位和1799.8万平方米的航站楼。另外还新增了93个通用机场,将全国管理的通用机场数量增加到33
学位
近些年来,卷积神经网络因其强大的建模及表达能力改变了甚至革命化了许多机器学习任务,视频显著性物体检测就是其中的一个。视频显著性物体检测旨在识别出一个视频内最具有显著性的物体,不仅有助于理解人类视觉系统的机制,而且还是许多高级计算机视觉任务不可或缺的预处理方法,例如视频物体分割、视频分类、视频重定时和自动驾驶等。视频显著性物体检测在日常生活中的应用也有很多,比如帮助审核视频内容的人员或进行视频监控的
学位