联合学习环境下保护隐私的数据聚合技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:www123123123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,联合深度学习已广泛应用于各个领域,例如图形图像分类、自动驾驶和语音识别等。然而,在对大规模数据进行训练学习过程中,存在泄露用户敏感数据的风险,而且运行设备的计算效率不足以满足训练需求。因此,提升隐私保护能力和提升计算效率是目前训练学习中亟待解决的两个问题。本论文基于联合学习环境下,考虑保护用户隐私的高效安全数据聚合方法研究。通过对已有的基于联合学习下保护隐私的数据聚合方案的了解及深入学习,明确联合学习的模型框架,分析总结了当下联合学习所面临的各种挑战,包括统计异质性、隐私保护、通信开销。通过研究发现,目前在联合学习下保护隐私的方案很少考虑某些用户(称为低质量数据用户)共享的数据质量低以及用户设备资源不同的根本问题。显然,在联合训练过程中,低质量数据可能会降低训练效率和精确性,甚至导致模型没有实际可用价值。所以,在设计联合学习方案时,除了考虑用户隐私,还应该考虑用户设备与用户数据的异质性,这是隐私与训练准确性及效率之间的一个权衡。针对目前联合学习所面临的问题,本文考虑将密码学知识用于联合深度学习环境,以达到保护用户数据隐私的目标。基于云环境的联合学习模型提出了两个保护用户隐私的方案:SAHPP与SAHD。其中,SAHPP考虑用户数据异质性,为用户计算“数据质量”分数,以保证全局聚合值主要基于对训练有较高贡献的用户数据。而SAHD方案作为增强方案,进一步优化了SAHPP,改进了密钥协商机制,同时考虑用户设备的异质性,提出用户“可靠性”参数,提高了模型训练的准确性及效率。此外,从安全性以及训练精准性、开销等性能方面分析了两个模型的安全性以及实用性。通过实验仿真与现有方案对比,两个方案有着较高的精确性和效率以及较低的通信、存储和计算开销。尤其增强方案SAHPP中,不仅考虑了异质性数据的情况,还考虑有较低设备资源的用户参与训练,并且利用多项式密钥协商机制,在达到一定效率的同时能够很好的保护用户隐私。
其他文献
参考作物蒸散量是表征大气蒸散能力,评价气候干旱程度、植被耗水量的重要指标。本文根据新疆塔里木盆地周边绿洲区的5个典型气象站近50余年的逐日气象资料,采用PM公式计算各
为了研究生物炭肥料对河套灌区耕层土壤肥力及含水率的影响,试验设置以当地常规施肥为对照(CK),分别采用与CK处理等养分(C3)、70%养分(C2)和40%养分(C1)的生物炭肥料处理,共计4个处理
运用清洁生产的观战和方法,论述宝钢削减SO2的方徊是:洁净原燃料,清洁生产工艺,节能降耗和烟气脱硫四管齐下。要达到削减SO2的目的,必须在生产的全过程下功夫,而不是仅限于烟气脱硫。
为克服弯曲试验方法评估热连轧钢板弯曲性能的缺陷,介绍了几种定量评估弯曲性能方法的试验情况,着重分析了均匀延伸率法的优点及其在宝钢的应用前景。
以碳二亚胺(EDCI)为连接剂将抗肺癌单克隆抗体(McAb 3D3与血卟啉衍生物(HpD)共价连接,制备成免疫光敏剂,经ELISA法测定及溶血试验,结果表明偶联物保留了 McAb的反应性及HpD的
采用3因素2水平的正交试验设计,在新增沙地温室设施内进行黄瓜生产试验。结果表明,防渗措施和灌溉方式是黄瓜品质和产量的主要影响因素,同时是黄瓜生理指标的首要影响因素,以
目的:观察PiNLOCK自攻自断螺纹钉用于修复大面积牙体缺损的临床疗效.方法:选择41例45颗牙体组织大面积缺损的患牙,于牙本质内植入PiNLOCK自攻自断螺纹钉,外周再做充填体或修
为保护人类生存环境,践行“低碳生活”要求,我校结合实际情况,提出“校园低碳生活”的具体要求,即节约水电和纸张,实现教材循环利用,减少二氧化碳排放量,从点滴做起。此次活
宝钢一、二期过程计算机正面临设备老化、功能满足了不生产与质量控制日益增长的要求的状况。如何对过程计算机系统进行硬件更新、软件移植与扩充,是一个值得研究的课题。钢管
本文分析了我国当前R6P型电池生产设备的现状和存在的问题。以天水电池厂自制成功的单机连动R6P型电池机械化生产线为依据,详细论述了解决生产线中关键技术问题的措施和方法,
期刊