【摘 要】
:
信息时代的来临催生了人工智能技术的快速发展,为打破数据孤岛,同时避免传统机器学习模式集中收集训练数据带来的隐私威胁,联邦学习技术得以诞生。联邦学习由一个中央服务器与多个参与者组成,通过多次迭代共同训练一个全局模型。尽管前景看好,联邦学习应用到实际场景中时仍然遇到了很多的挑战,其中最为突出的就是异构问题与隐私问题。首先,联邦学习作为一种分布式机器学习框架,其训练数据在各个客户端的分布往往非均匀,数据
论文部分内容阅读
信息时代的来临催生了人工智能技术的快速发展,为打破数据孤岛,同时避免传统机器学习模式集中收集训练数据带来的隐私威胁,联邦学习技术得以诞生。联邦学习由一个中央服务器与多个参与者组成,通过多次迭代共同训练一个全局模型。尽管前景看好,联邦学习应用到实际场景中时仍然遇到了很多的挑战,其中最为突出的就是异构问题与隐私问题。首先,联邦学习作为一种分布式机器学习框架,其训练数据在各个客户端的分布往往非均匀,数据的质量、规模以及内容都表现出鲜明的个人特点,这就使得全局模型在部分客户端的效果与用户的期望相去甚远。为避免异构场景下单一全局模型的性能问题,如何在联邦学习的基础上为用户设计个性化模型成为了一个重要的研究方向。其次,联邦学习不足以提供完全有效的隐私保护能力,攻击者可以根据用户上传到中央服务器的参数或梯度来反推出数据信息,从而造成隐私泄露。因此如何设计有效的隐私保护方法也是联邦学习中一个值得深入研究的问题。为同时解决联邦学习中的异构问题与隐私问题,实现二者的有效结合,本文分别基于差分隐私技术与c Mix匿名通信网络设计了两种具有隐私保护能力的个性化联邦学习方案。本文首先基于差分隐私中的拉普拉斯机制提出了一种具有隐私保护能力的个性化联邦学习算法,并针对本地加噪严重影响模型精度的问题对拉普拉斯机制进行了改进。本方案将用户本地模型分为基础层与个性化层,在每轮迭代过程中,对基础层的每一层分别添加拉普拉斯噪声,并将扰动后的参数根据原参数的边界值进行截取,再将结果发送至中央服务器进行聚合。本文还通过理论分析证明了改进后的拉普拉斯机制满足严格差分隐私定义,最后通过实验分析了基础层数量、隐私预算以及数据异构程度对系统准确率的影响,并与传统联邦学习算法和传统拉普拉斯机制进行对比,验证本方案的有效性。本文还提出一种基于c Mix的个性化联邦学习方案,为避免原有基于匿名网络的隐私放大方法引入差分隐私所带来的精度损失,本文设计了一种隐私聚合协议来防止服务器直接接触原始参数。整个训练过程分为参与者权重分配阶段、密钥生成阶段、预计算阶段与实时阶段。在参数上传之前,用户将基础层参数乘以分配到的权重并使用公钥进行加密,再经c Mix混淆后发送给中央服务器,中央服务器则根据参与者公钥之和解密聚合结果,从而完成一轮迭代。由于本方案没有对参数做除加密外的其他修改,因此可以扩展到其他个性化联邦学习框架,如元学习、迁移学习等。接下来本文通过安全性分析,验证了方案可以达成身份不可关联性与数据机密性。最后本文通过实验分析了基础层数量与实时阶段通信时延的关系,并与安全洗牌方案进行对比,验证本方案在保持系统准确率上具有一定的优越性。
其他文献
为从根本上提升水利泵站运行期间的经济效益与生态效益,需要在原有水利泵站单体节能基础上采用目标电耗理念,对各能耗单元进行不断优化。注重分析水利泵站节能优化方式,评估不同节能方法的运行效果。基于此,文章分析了水利泵站改造前的耗能情况,提出现有目标电耗控制技术,确保实际研究结果能够为类似水利泵站节能改造工作提供重要意义。
佩戴安全帽是防止施工作业人员头部损伤的有效方法之一,利用目标检测技术识别工人安全帽的佩戴情况,能够协助完善施工现场安全措施、有效预防安全事故发生。然而,现有安全帽佩戴检测算法多存在小目标识别准确率低、密集遮挡场景检测难度大、复杂场景适应性差的问题。因此,本文立足于深度学习目标检测技术对安全帽佩戴检测相关算法进行研究与改进,提出了一种基于改进YOLOv5s的安全帽佩戴检测模型,以解决实际安全帽佩戴检
激光诱导击穿光谱技术(Laser-induced Breakdown Spectroscopy,LIBS)是一种基于原子发射光谱的多元素分析技术,具有样品预处理简单、快速分析、实时在线等特性。将模式识别算法应用于LIBS光谱数据分析中,以提高其分析性能,推动LIBS技术的应用进程。针对丹参产地识别问题,基于LIBS技术得到丹参的光谱信息,利用支持向量机(Support Vector Machine
钻杆是钻井过程中实现力的传递、钻头钻进、井轨迹的延伸和导向钻井控制的主要设备,钻杆螺纹是否完好是钻杆安全连接的关键。因此,针对钻杆公母螺纹检测,研究合理有效的检测方法是实现全自动接钻杆的关键基础性研究。本文采用图像处理技术测量钻杆螺纹参数的方法,通过大量的实验,深入的研究了钻杆螺纹检测方法。主要的研究成果有:首先介绍钻杆螺纹检测系统的硬件实验平台和软件系统组成,根据选型规则搭建图像采集系统。其次,
镀铬是电镀产品生产中一种比较重要的工艺,其温度控制效果和自动化控制水平直接关系到镀件的质量与产量和电镀工艺能否顺利执行。因此,设计一个可靠性高,稳定性好的自动控制系统在镀铬生产线中是十分重要的。本文以镀铬自动生产线控制系统设计为目标,对镀铬生产线的工艺和控制要求进行分析,并结合企业的实际情况,设计了一套基于TIA Portal Wincc和西门子S7-1200 PLC电镀生产线自动控制系统,对自控
随着深度机器学习与人工智能的迅猛发展,强化学习作为最接近“强人工智能”范畴的机器学习方法已成为近年来的热门研究方向。强化学习采用无监督的方式进行“试错”学习,智能体基于自身经验学习最优策略,无需预先标注好的样本或大量的先验知识,对于解决动态场景下的复杂问题优势明显,应用潜力十分巨大。目前,对于强化学习的研究主要集中于深度强化学习以及多智能体深度强化学习两个方面。对于深度强化学习,已有越来越多不同种
近年来,随着云计算技术的不断发展,人们不再担心存储计算资源受限这一问题,但也随之导致了数据泄露事件的频繁发生,这时时刻刻提醒着人们需要对自己的数据信息进行隐私保护。通常,用户会选择将加密后的数据存储到云服务器中,但这种方式会导致对密文数据的检索变得非常困难。由此提出了可搜索加密(Searchable Encryption,SE)技术,它能在密文状态下对用户查询的关键字进行匹配检索,但如何使密文检索
监控摄像头目前已被广泛应用于公共或私人场所,并在安防活动中扮演着重要的角色,但其带来的隐私安全问题也不能被忽视。监控摄像头通常被安装在酒店前台,超市收银台或售票处等公共场合的角落。在这些场合下,用户输入个人识别码(PIN)解锁或付款的过程可能会在有意或无意中暴露。一旦PIN被破解将会给用户带来严重的隐私泄漏问题和财产损失,然而,几乎没有监控设备的制造商意识到这一隐患。PIN是一种传统的基于知识的认
随着大数据时代的到来,各行业在互联网技术的加持下迎来了蓬勃发展。海量的数据资源蕴含了丰富的实际价值,经过数据挖掘等技术的处理分析可以创造出巨大的社会以及经济价值。大数据技术给各领域带来便利的同时,将数据安全问题辐射到更广泛的领域。数据被盗、非法篡改、恶意传播等大规模数据安全事件屡见不鲜,资源的开发共享和数据的安全保护已成为数字经济时代长期存在的矛盾难题之一。数据库水印技术可以有效地保证数据库所有者
癌症,是一类严重危害人类生命健康的复杂疾病,具有高度异质性。癌症亚型识别问题是癌症研究领域中最重要的问题之一,同一种癌症的患者在生存风险、对药物的敏感性等多个方面存在明显差异,这意味着癌症存在多种不同的亚型,因此研究癌症的亚型划分,能够为癌症患者提供准确的诊断和治疗。高通量测序技术的不断发展,使得测序的规模迅速扩大,并且测序成本极大降低,现已积累了大量癌症患者的基因组、转录组、表观基因组以及蛋白组