跨数据孤岛的联邦学习数据隐私保护方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:a595165933
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐私问题限制了数据的流通和利用,使拥有数据的各方形成了一座座数据孤岛。联邦学习和同态加密或差分隐私相结合能够实现跨孤岛的联邦学习,打破这种数据孤岛。基于同态加密的联邦学习在实现分布式机器学习的同时能够保护用户数据隐私,但加密后的数据是透明的,无法检测正确性,因此对恶意节点的容忍能力不足。使用差分隐私能够在联邦学习过程中保护各节点的数据隐私,但在模型参数中添加噪声会降低模型检测的准确率和收敛效率。针对容错能力不足的问题,提出了基于分组聚合的容错同态加密联邦学习模型(Fault-tolerant Homomorphic Encryption Federated Learning Model Based on Grouping Aggregation,GFTFL)。GFTFL每一轮迭代分两次聚合。第一次聚合将参与训练的节点分为若干贡献组,并使用基于Paillier算法的同态加密方案对每个贡献组的训练结果加密,对每一个贡献组聚合后方可解密得到相应贡献组的聚合结果,以实现梯度隐私保护。第二次聚合使用全局测试集对每个贡献组的训练结果进行检测,选取准确率更高的若干贡献组参与聚合,得到最终训练结果,以实现容错机制。GFTFL实现了存在恶意节点环境下用户梯度隐私保护与本地模型可检测,进而选取测试结果更优的一部分贡献组参与聚合,提高了联邦学习过程对恶意节点的容忍能力。实验结果表明,在存在恶意节点的环境下,GFTFL的容错能力优于传统方案。针对噪声影响准确率的问题,提出了基于卡尔曼滤波的差分隐私联邦学习模型(Kalman Filter-based Differential Privacy Federated Learning Model,KDPFL),将模型参数更新方程转化为状态转移差分方程,基于状态更新差分方程与噪声分布计算卡尔曼增益,通过卡尔曼增益系数修正参数更新以达到降低噪声的目的,并在非独立同分布(NonIID)与独立同分布(IID)两种数据分布情况下构建了有效性的验证方案,实验结果表明相比差分隐私联邦学习,本文提出的方法准确率最大提高了约3%。
其他文献
目前,Top-N查询处理和优化的研究主要是针对Top-N选择查询,而Top-N连接查询相关研究仍然较少。传统Top-N查询处理方法通常未整合实体解析技术,对于包含重复元组的脏数据集,这些方法可能检索出重复的Top-N结果,难以得到足够多的有效元组,查询效率低下。此外,对于大型数据集,实时实体解析是一个具有挑战性的问题。因此,如何将实时实体解析与Top-N连接查询有效融合,是一个有待深入研究的重要课
学位
鲁棒极限学习机因其较高的泛化能力和较快的学习速度。已经成为比较常用的机器学习工具之一,并在现实中的许多方面得到应用。然而,传统的鲁棒极限学习机还有不足之处:一、大多数鲁棒极限学习机以2L范数为损失函数。众所周知,2L范数对于异常值非常敏感,更容易受到极端异常值的影响,当数据中含有过多极端异常值时,大多数算法将崩溃。二、鲁棒极限学习机对于神经元数量非常敏感,当神经元数量过多时,可能会发生过拟合,导致
学位
物联网技术的不断发展极大的改善了人们的生活质量,同时也带来了一些新的挑战。万物互联时代离不开数据的交互,访问控制被认为是实现数据安全交互的一种重要方式,然而现有的访问控制方案大多都是基于集中式服务器构建的,存在单点故障问题。区块链应用了多种技术实现了去中心化,被认为是一个很有前途的分布式解决方案,能够有效提高访问控制系统的可靠性。因此,本文对基于区块链的访问控制机制展开研究,主要工作如下:针对传统
学位
基于云计算平台的云存储系统为用户提供了海量、可弹性扩展、低成本和低能耗的远程存储服务,因此越来越多的人选择将自己的数据外包给云服务器,进而不受本地有限存储空间的约束。然而,用户一旦将数据存储到云服务器,将失去对数据的物理控制,存储在云服务器中的数据便面临着泄露、恶意删除和被篡改的风险。随着云存储安全的问题日益凸显,审计云数据完整性的持有性证明方案成为研究者们关注的重点,学术界提出了多种数据持有性证
学位
随着机器视觉在三维领域的发展,点云以其便于采集、数据量小和信息丰富准确的优点得到了大量关注,相比于其他数据表现形式,诸如体素、mesh网格等,点云的特性使其更适用于自动驾驶、机器人视觉等需要快速处理的应用。点云通常由激光传感器或深度相机扫描获取,会出现物体不完整和坐标系不统一的情况。点云补全是从不完整的点云中挖掘信息,补全点云的缺失信息,构成一个完整对象,常用于解决扫描物体不完整的问题,点云配准是
学位
车辆再识别是在海量车辆图像或视频中检索目标车辆的过程,属于图像检索的子问题。在交通系统中引入车辆再识别技术,既能提高交通管理自动化程度又能保证对车辆定位追踪的准确性,传统的车辆图像处理技术不能很好的提取车辆特征,从而影响后续车辆再识别的效果。本文针对车辆特点及其所处复杂外界环境的特点,研究有效的车辆图像再识别算法。主要工作有:(1)基于MAPANet的车辆图像特征提取。依靠车辆图像中具有区分性的局
学位
软件漏洞导致了许多系统攻击和数据泄露,软件安全问题逐渐引起关注,软件漏洞检测现已成为一个重要的研究方向。近年来,深度学习技术已应用于漏洞检测,基于深度学习的漏洞检测方法不需要手动定义特征,实现了低漏报和低误报。深度学习技术依赖于数据集,最近的研究发现,不同的漏洞数据集对基于深度学习的智能漏洞检测方法的效果有不同的影响。漏洞数据集的真实性、不平衡性和重复率会影响基于深度学习的智能漏洞检测方法的有效性
学位
近年来,随着大数据、人工智能、高速网络等技术的发展,入网的物联网设备数量迅猛增长。物联网设备在智能家居、智能电网、智慧城市等应用场景下为人们生活生产带来便利的同时,也给网络带来了潜在的威胁。为了保证物联网网络的安全,需要对物联网设备进行高效,准确的管理和识别。针对物联网设备进行管理时,时效性要求较高,这意味着在网关处进行设备识别和管理具有十分重要的意义。然而目前提出的物联网设备识别方案普遍开销较高
学位
模糊蕴涵是模糊集理论中一类主要的逻辑连接词,在模糊逻辑、近似推理、模糊控制、模糊专家系统、模糊神经网络、图像处理和数据挖掘中发挥着重要的作用。一方面,广泛的应用推动着模糊蕴涵理论的研究。另一方面,随着人工智能的发展,模糊蕴涵在不确定性知识表示与推理中发挥着不可或缺的作用。因此,在过去十几年中,关于模糊蕴涵的性质、刻画、构造方法与应用一直是模糊逻辑中的研究热点。本文主要围绕几类新型模糊蕴涵的性质、构
学位
随着各领域对目标检测任务的需求日益增多,目标检测模型面临的挑战也逐渐多样化。虽然无锚框目标检测模型当前性能突出,但在特征学习过程中存在锯齿问题,并且对多尺度目标处理的结果不够理想,因此,设计了一种抗锯齿无锚框目标检测模型;针对无锚框目标检测模型存在的参数量冗余、计算复杂度高等问题,设计了一种由注意力模型引导的模型压缩方法。具体研究内容如下:(1)抗锯齿无锚框目标检测模型为了解决无锚框目标检测模型存
学位