隐私保护与安全增强的联邦学习技术研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:liongliong456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的普及,智能手机、可穿戴设备、智能传感器等一系列现代终端设备每时每刻都在生成大量的数据。依托海量的数据与硬件计算能力的提高,机器学习技术进入了飞速发展的黄金阶段,并已经在人们日常生活中发挥了广泛的作用。使用联邦学习技术,允许多个数据持有者协同训练学习模型,有助于破除数据孤岛,解决单独学习时存在的数据数量与质量不足等问题。然而,机器学习算法本身的设计缺陷,以及复杂学习模型工作原理难以理解等因素,导致现有联邦学习框架中存在隐私数据泄露、学习结果偏差等安全隐患。因此,如何提高联邦学习系统的安全性,使海量用户数据发挥充分的价值,是当前亟须解决的问题。鉴于此,本文以构建安全可靠的联邦学习系统为最终目标,从信息安全三要素——机密性、完整性、可用性三方面出发,分别对联邦学习中训练数据机密性、计算过程完整性、学习结果可用性开展研究。本文的主要内容和创新点总结如下:(1)针对学习模型可能导致隐私训练数据信息泄露的问题,本文分别针对神经网络与梯度提升决策树两种典型机器学习算法,提出了相应的隐私保护模型训练方案。对于神经网络算法,本文提出使用差分隐私技术扰动学习任务目标函数以模糊训练结果,防止上传结果泄露其隐私信息;此外,使用差分隐私技术随机选择本轮聚合的参与者更新结果,防止聚合结果泄露参与者数据质量与分布等信息。对于梯度提升决策树算法,本文基于不同子树构建过程相对独立的特点,提出不同参与者按序训练的协同训练方法,并通过迭代划分训练数据集与并行传输模型等方式,降低差分隐私预算消耗与通信时间。(2)针对联邦学习中参与者可能通过伪造更新结果获取不当利益的问题,本文提出了一种基于抽样的训练过程完整性验证方法,随机抽取训练过程中多次不同的迭代并使用基于密码学的可验证计算技术进行验证,以高概率确保参与者完成训练任务;为降低每次验证的计算开销,本文设计了一种针对机器学习模型的简短承诺技术,并从理论上证明了其安全性;此外,还针对神经网络、支持向量机等五种典型机器学习算法分别设计了优化的电路表达形式,以尽可能提高验证效率。(3)针对联邦学习中攻击者可以通过设计特殊上传结果破坏学习模型功能的问题,本文提出了一种基于交叉检验的异常参与者检测方法。服务器在收到参与者返回的更新结果后,将这些结果随机发送给其他多个参与者进行测试,并根据测试结果调整模型聚合时不同参与者的权重参数。为避免参与者拥有的数据为非独立同分布时检测失效的问题,本文提出了一种根据参与者持有数据分布动态调整检测任务分配的方法;此外,本文还通过将多个上传结果聚合成少数几个子模型并添加差分隐私噪声的方式,在保护参与者隐私的同时降低检测过程带来的通信开销。
其他文献
在中国实现“站起来”与“富起来”的历史目标并开启“强起来”的新时代之际,通过中国现代话语体系建设来争取话语权并提升文化“软实力”就成为当前社会主义现代化建设中的重要任务。话语体系是围绕特定主题并依据一定内在逻辑和分析框架而构建起来的概念、范畴和理论表述体系,是话语主体立场和逻辑的集中体现,它通过影响和塑造受众的知识、思维、观念和行为,形成了同现实的物质利益与权力相关联的话语权。语境、主体和文本是话
学位
"跨栏跑运动"是新时期小学田径运动的竞赛项目,能提高学生的身体素质,锻炼他们实际的体育技能。但由于小学生年龄较小,身体素质还不够强,各部位肌肉力量还不够,在进行"跨栏跑运动"时往往需要教师特别的引导。随着素质教育理念的不断深入,教师要结合新时期的体育课程,为学生提供有效的跨栏跑训练平台,提升学生各方面的身体素质。本文就从当前小学体育课堂中的跨栏跑训练出发,对该项目训练的方法和模式做几点分析。
期刊
在科学哲学史上,实在论和反实在论围绕“理论科学中基本实体是否真实存在”的问题展开过旷日持久的争论。结构实在论作为科学实在论的一支,努力推进理论科学中基本实体的结构进路,为科学实在论的发展做出了重要贡献。然而,物理世界的基本实体究竟是什么?科学哲学界甚至科学界并未形成一致认识。近年来,随着量子信息科学技术的发展,信息结构实在论和量子信息结构实在论应运而生,它们分别把信息和量子信息视为物理世界的基本实
学位
肿瘤微环境中的免疫组成与抗瘤治疗效果息息相关。当前,肿瘤组织内存在效应性免疫细胞丰度低、抗肿瘤免疫功能缺失、促肿瘤生长相关的负调节细胞丰度高等问题。针对肿瘤免疫微环境影响抗瘤治疗效果这一科学问题,本研究设计、构建了一系列基于细菌及免疫细胞的仿生和生物基材料,改善了肿瘤免疫微环境的组分,促进瘤内效应性免疫细胞浸润,激活并增强机体的抗肿瘤免疫效应,展现出较好的抗肿瘤免疫治疗潜力。本文第二章,基于铁基磁
学位
中国大陆构造环境监测网络(Crustal Movement Observation Network of China,CMONOC,简称陆态网)是我国“十一五规划”重大科技基础设施。采用了多种地球观测技术,如GNSS、VLBI、SLR、水准测量和精密重力测量等,能够有效对中国大陆的地壳形变、重力场变化、水汽含量、电子含量变化等的实时监测,具有重要的意义和应用价值。自1999年3月试运行到目前,已经
学位
有机发光二极管(OLED)由于具有视角宽、响应时间短以及柔性可弯曲等优异性能成为了目前最具发展潜力的新型平板显示技术之一。从其发光机理来看,OLED发光材料经历了传统荧光材料到磷光材料再到热活化延迟荧光(TADF)材料三个发展阶段。在外加电场作用下,OLED材料受激形成比例为1:3的单重态激子(25%)以及三重态激子(75%),在第一代传统荧光材料中,三重态激子无法通过辐射跃迁的形式回到基态,只有
学位
对于城镇这个“机体”而言,老旧小区就如同“细胞”,而红色文化则是“细胞修复”的重要营养来源,它的融入不仅让老旧小区人文环境得到改善,对社区发展和文化传承也有着重要意义。本文以宿迁市宿城区老旧小区为研究对象,探索红色文化在老旧小区改造中的应用,提出利用红色文化在小区公共设施中的表达,让红色文化更加有效地融入老旧小区改造,使老旧小区改造升级更有创新性和传承性。通过对老旧小区改造中融入红色文化的研究,增
期刊
<正> 氯对淀粉的氧化作用,早在1829年已报导过淀粉与氯或亚氯酸的氧化发应。1896年实现了工业化生产。使用氯气对淀粉氧化作用于1895年获得德国专利及1905年获得美国专利。对淀粉氧化变性产物的结构及性能
期刊
细胞是生物体的基本单位,是研究人类生物学和疾病的关键,理解支配不同类型细胞生成的机制一直是生物学上的一个重大挑战。现在,随着单细胞转录组测序(sc RNA-seq)等先进技术的引入,生物学家具备了在单个细胞分辨率揭示不同类型细胞异质性的能力。在此背景下发起的人类细胞图谱计划(the Human Cell Atlas Project),旨在为我们提供每一种细胞类型的独特身份认证,一个细胞类型如何协同
学位
现实社会中的很多问题都可以抽象为实值优化问题,因此实值优化问题的求解已经成为当前研究热点.元启发式优化算法是一类有别于传统优化算法的新兴算法,具有简单易实现、灵活且通用等特点,非常适合求解传统优化算法失效的复杂实值优化问题.然而,元启发式优化算法在求解过程仍然存在易早熟、收敛慢、控制参数敏感、难以有效应对大规模问题等不足,严重影响了算法的性能表现,限制了算法在现实生活中各个应用领域的发展.为了更高
学位