非独立同分布数据下的联邦学习算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hulin510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据驱动的人工智能技术飞速发展,机器学习技术在现实生活中被广泛应用。过去机器学习模型常采用集中式训练的方法,该方法需要在中央服务器上搜集并存储大量优质数据。现实中由于行业竞争、隐私安全和法规限制等诸多原因,数据的集中搜集和存储遭受着极大的限制。联邦学习作为一种新型分布式机器学习范式,能够在保障用户数据安全的同时充分利用设备数据。联邦学习能够在保护用户隐私的同时使得大量设备协同训练机器学习模型,并使参与者彼此从中获益。然而联邦学习中存在数据在统计上异构的挑战,该问题会使得模型训练变得低效。联邦学习中的数据由数据所有者独立产生,各参与者的数据通常具有不同分布特征。非独立同分布的数据在真实联邦学习系统中广泛存在,而现有的联邦学习算法主要基于数据服从独立同分布的假设,在非独立同分布数据下算法性能会显著变差。针对这一问题,本文在现有联邦学习算法的基础上进行了一系列的研究,本文主要研究工作如下:一、通过仿真实验验证现有联邦学习算法在非独立同分布数据下性能较差。通过常见的MNIST数据集和CIFAR-10数据集产生非独立同分布的实验数据集,并对比了现有联邦学习算法在不同数据分布情况下的性能。二、通过生成对抗网络对联邦学习中非独立同分布的数据进行数据增强。使用生成对抗网络能够在不涉及用户隐私的情况下生成虚假数据,参与者将少量的虚假数据加入本地模型训练数据,就可以增强联邦学习算法的性能。通过MNIST和CIFAR-10两个数据集上的实验验证,该方法使得联邦学习算法在非独立同分布的数据下有很大的性能提升。三、通过知识蒸馏方法聚合各参与者的模型。非独立同分布数据下,各参与者训练得到的子模型学习到了不同知识,通过知识蒸馏方法可以高效地将各子模型所学得的知识整合到全局模型中。通过实验测试,该方法在非独立同分布数据下有良好的性能。四、将上述两种方法整合到联邦学习系统中。整合后的联邦学习算法与现有的Fed Avg算法兼容,且实验结果表明该算法在非独立同分布数据下的性能显著优于Fed Avg算法。
其他文献
随着社会经济的不断发展,人民群众对于生活品质和人居环境的要求不断提高,噪声污染问题也日益凸显。由于噪声的产生与人们的生活状态、主观意愿高度关联,先进的技术手段对于噪声监测和防治必不可少。定向声波发射技术可以用于具有高指向性的声源装置,由于避免了声波的扩散,从根本上减少了噪声的产生。参量阵是定向声波发射的代表性技术之一,可以在较小尺寸上实现定向声波发射。虽然许多的研究工作都致力于降低参量阵的失真水平
无线传感器网络具有无线感知以及无线通信的作用,是重要的三维网络研究技术之一。传感器网络由多个具有自组织能力的节点组成,是当前网络研究中的一个热门领域,应用于多个领域方面,例如军事预防,地震监测,环境监测以及海底勘探等。目标跟踪技术是研究三维空间发展的重要部分,利用多个传感器节点的数据信息估计出目标当前时刻的状态。在目标跟踪系统中,利用滤波技术估计目标运动状态,根据滤波算法来消除相关的不确定性,实现
切换系统是一类动态混杂系统,由若干个子系统和一个协调子系统运行的切换规则构成,其在理论研究和实际应用中有着重要作用。在现代科技社会中,切换系统有着广泛的应用,如机械自动化、电力电子、交通网络等,并且关于切换系统的研究也日益受到关注。为了减少切换系统稳定性条件的保守性,本文引入矩阵多项式用于构造李亚普诺夫函数。矩阵多项式可以引入更多自由变量,从而降低线性矩阵不等式条件的保守性。根据这一特性,本文将矩
随着智能交通的需求,车联网系统是改善城市交通压力的一个重要突破点。其中车辆计数已经成为一个重要的问题,它可以用来缓解交通拥堵,提高交通灯的通行效率。城市规模的多摄像机车辆跟踪也是智能城市和交通管理中的重要任务。道路交通异常检测是计算机视觉的基础工作,在视频结构分析和城市交通分析中起着至关重要的作用。本文针对车联网环境下基于深度学习的路网交通优化研究,将主要对车辆计数、车辆跟踪和交通异常检测方法进行
目标定位,特别是多目标定位问题,一直以来都是信号处理领域内的重点问题,目标定位在雷达、声呐以及导航系统中都起着至关重要的作用,在射电天文学,地震学等领域中也得到了广泛的应用。近年来,目标直接定位(direct position determination,DPD)算法因其在某些条件下更加出色的性能,逐渐成为了目标定位算法中的研究热点。随着分布式无线传感器网络相关研究的不断深入,分布式算法可拓展性和
目标检测是指首先预设一组与任务相关的类别,然后使用算法检测出图像中可能存在属于预设类别范围的目标。它是目前计算机视觉领域最为核心的任务之一,作为上游任务对其下游任务有着积极与深远的影响。虽然目标检测从传统方法阶段到深度学习阶段的发展历史久远而且非常成熟,但是目标检测应用于特殊领域,比如水下目标检测、无人机目标检测等还具有巨大挑战。由于数据采集困难,相比现有大规模公开数据集,这些领域的影像的规模和内
对目标区域的监视或者搜索是多智能体系统的重要应用领域之一。区域覆盖算法作为多智能体系统的一种控制算法,决定着系统能否高效率的完成区域覆盖。因此,优化区域覆盖算法,提高区域的覆盖效率对多智能体系统的应用具有重大的意义。目前对区域覆盖算法的研究主要集中在:智能体的运动控制模型的改善和覆盖点规划的优化。但目前研究仍存在以下问题:(1)智能体难以同时考虑自身当前的覆盖状况以及邻居的覆盖状况来对覆盖点进行协
随着深度学习任务领域的细分和深入,神经网络的结构日益复杂。为了确保复杂模型的可靠性,对模型进行可解释性研究已经成为深度学习研究中不可或缺的重要环节。而生成对抗网络近年来在诸多领域有着广泛应用,包含但不限于风格迁移、语义分割、图像生成等计算机视觉领域,因而对生成对抗网络进行可解释性研究具有重要意义。但现有的基于生成对抗网络的可解释性研究仍存在着不少如模型不稳定、优化困难等问题亟待解决。在本文,我们主
水下无线传感器网络作为海洋勘测、数据收集、自然灾害预测的重要设施之一,广泛应用在水下领域。水下传感器节点定位作为水下无线传感网在各领域的应用基础而备受关注。现如今,由于复杂的水下环境,水下节点定位仍面临节点定位率低、时间同步、定位精度差和节点移动性等诸多挑战。因此,基于水下无线传感器网络的节点定位算法极具研究价值和意义。本文首先介绍了水下无线传感器网络的网络结构以及各组成部分功能、基于水下无线传感
近年来,标准化考场的建设获得了广泛的关注。如何将人工智能技术引入标准化考场当中具有非常重要的实际意义。当前,依靠人工查看考场监控视频与监考官现场记录作弊行为相结合的监考方式人力成本巨大,且极其容易发生遗漏的情况。本文针对考试场景中可能出现的各种作弊行为,研究了基于深度学习的考场作弊行为识别方法,构建考场作弊行为数据集,结合边缘位移提取、运动特征增强与长时时序建模,解决考试场景下作弊行为识别问题。本