【摘 要】
:
随着移动智能设备的快速普及,研究机构通过利用云平台、物联网、移动终端等智能设备不断地加以汇总原始数据(如医疗图像数据、银行金融数据等)以进行数据分析、挖掘以及模型训练,从而能够获取数据中潜在价值。然而汇总的原始数据中蕴含着大量的敏感信息,一旦直接发布就会造成严重的数据隐私和安全问题。为此,政府出台相关法律法规,禁止数据拥有者随意发布用户原始数据,企业之间也形成数据壁垒,带来数据孤岛问题,这极大地阻
论文部分内容阅读
随着移动智能设备的快速普及,研究机构通过利用云平台、物联网、移动终端等智能设备不断地加以汇总原始数据(如医疗图像数据、银行金融数据等)以进行数据分析、挖掘以及模型训练,从而能够获取数据中潜在价值。然而汇总的原始数据中蕴含着大量的敏感信息,一旦直接发布就会造成严重的数据隐私和安全问题。为此,政府出台相关法律法规,禁止数据拥有者随意发布用户原始数据,企业之间也形成数据壁垒,带来数据孤岛问题,这极大地阻碍了相关科学技术如深度学习、人工智能等的发展。因此,数据隐私的保护已经成为研究者们最为关注的问题之一。为了解决数据发布的隐私泄露以及数据孤岛问题,本文对数据的隐私保护开展了以下研究:(1)围绕数据的生命周期,本文将数据隐私保护分为数据收集、数据发布和数据使用三个阶段。然后根据每个阶段可能存在的隐私风险问题,详细总结和归纳了现有的面向数据收集、数据发布和数据使用的基于差分隐私的隐私保护方案,以及分析了这些方案的优缺点。(2)针对数据发布过程中图像数据面临的隐私保护和可视化质量之间的矛盾问题,提出一种基于离散余弦压缩变换和差分隐私保护的图像数据发布机制QAPP。该机制由三个阶段组成。首先,图像数据经过离散余弦变换以获得其余弦系数矩阵;接着利用提出的选择函数确定余弦系数矩阵的最佳压缩维数,根据选择维数压缩余弦系数矩阵以保留图像数据的主要特征;最后,将合适的拉普拉斯噪声注入到压缩矩阵中实现差分隐私保护,并将添加噪声的压缩矩阵逆余弦变换重建图像数据。这样既可以最大限度地减少差分隐私机制带来的噪声误差,又可以保证图像数据具有较好的可视化质量。通过主观和客观的指标评估以及基于真实图像数据集的实验表明,QAPP可以比类似的基于差分隐私保护技术的方法更好地平衡图像数据质量和隐私。(3)针对数据使用过程中模型训练面临的隐私攻击和模型安全问题(其最终会导致数据孤岛问题),提出一种基于联邦学习框架的兼顾差分隐私保护和模型安全防御的分布式模型训练系统LDP-Fed+。具体地,在联合模型训练过程中,在本地端引入本地扰动模块,通过特征提取、二进制编码和解码、随机响应以扰动用户原始数据,然后对扰动数据训练以获得满足差分保护的本地扰动参数,从而有效地应对模型反演攻击;其次,在服务端增加安全防御模块,利用辅助模型和差分指数机制选择合适数量的本地扰动参数进行聚合以应对成员推理攻击和增强模型安全防御。实验结果表明,与其他基于差分隐私的联邦学习模型相比,LDP-Fed+在保证严格的隐私保护同时,对模型安全具有较强的鲁棒性,对模型训练具有较高的准确性。
其他文献
随着信息技术产业与互联网行业的蓬勃发展,日常便捷的生活与工作环境离不开个人身份识别系统。目前,使用证件、密码等传统的判别身份的方法由于无法满足人们的日常需求逐渐被淘汰,基于人体生理特征的生物信号身份识别技术逐渐成为研究热点。由于不同个体间存在的差异性,且生理信号独有的唯一性、稳定性、难伪造性等特征,利用其进行人体的身份识别具有得天独厚的优势。本文以光电容积脉搏波(PPG)信号与心电(ECG)信号为
随着我国社会经济发展及人口老龄化加剧,针对膳食与健康的核心问题,开展食物的营养功能评价和相关营养干预研究已成为食品营养学研究的重要内容。芝麻酚(Sesamol)是我国重要油料作物芝麻中的主要活性成分,具有极强的抗氧化性,被广泛应用于食品生产加工、医药日化研发过程中。近年来研究发现,芝麻酚可以透过机体血脑屏障,并在脑内发挥神经保护作用。然而,目前关于芝麻酚能否改善衰老及其相关的神经退行性疾病诱导认知
染色体易位产生的PML/RARα融合蛋白是驱动急性早幼粒细胞白血病(Acute promyelocytic leukemia,APL)发生发展的关键因子。PML蛋白是重要的抑癌蛋白,通过形成PML核体这一关键结构发挥抑癌作用。大量研究显示,PML/RARα融合蛋白可通过破坏PML核体的结构进而干扰PML的抑癌活性,最终导致APL的发生。尽管PML核体被PML/RARα破坏这一现象早已被发现,但具体
不确定参数广泛地存在于工程系统中,研究不确定参数的影响对于提高系统的可靠性和鲁棒性具有重要意义。响应面方法是一种广泛使用的不确定分析方法,然而,在处理周期性时域响应时,其拟合精度会随着时间增加而逐渐降低。液体火箭设计中,工程人员迫切地需要掌握不确定参数影响火箭响应的规律。针对这两个问题,本文进行了以下三项研究:提出了响应面方法和信号分解方法相结合的不确定分析方法。在分析不确定参数对时域响应的影响时
随着移动通信技术的不断发展与进步,虽然异构网络的提出和使用满足了不同的业务需求,但是也增加了网络的复杂性。同时,伴随着5G网络的大规模商用,由于增强型新技术的不断引入,移动通信网络将变得更加复杂和异构。网络运营和维护的复杂性迫使移动运营商需要寻找新的策略来保持竞争力。然而,现有的网络故障诊断方式大多依赖于人工测试和时间堆积,存在优化周期长、资源耗费大等问题。因此,本文从大数据和人工智能的角度出发,
淡水是人类生存不可或缺的资源,越来越多的国家采用海水淡化技术来缓解淡水短缺。传统的海水淡化技术往往需要较高的能耗,因此,太阳能驱动界面蒸发技术逐渐引起关注,提高其太阳能利用率的核心在于光热转换材料。贵金属材料虽然具有较好的光热转换性能,然而其价格却十分昂贵,因此,本论文考虑采用平价金属替代贵金属材料制备成光热转换膜,并对其进行改性优化。同时,光热转换膜的性能不仅与其本身的性质有关,也与其表面结构有
背景和目的感染性心内膜炎(Infective endocarditis,IE)是一种由致病微生物感染心脏瓣膜、心内膜结构或其他心脏留置装置,从而导致局部组织炎症及全身菌血症的感染性疾病。尽管诊断和治疗手段不断进步,但IE的死亡率仍然居高不下。因此,早期识别高危患者以调整治疗方案,可提高生存率、改善长期预后。本研究旨在探究入院时中性粒细胞与血小板计数比值(Neutrophil-to-platelet
山西冬季降水量(主要是降雪)极少,全省各地市冬季降水量仅占全年降水的百分之二到三,冬季干冷,土壤墒情差,造成第二年春播困难或抑制越冬作物的正常发育。充分了解山西冬季降雪云的微结构和形成机理,可为设计人工增雪催化作业方案提供依据。为深入研究山西冬季降雪云微物理结构,本文借助飞机、雷达、卫星等观测资料,结合中尺度WRF模式,对不同天气系统影响下降雪云的结构特征和主要微物理过程进行详细分析。对2011年
怒江-萨尔温江(NSR)是东南亚最长的自由流动河流,在当地的生态保护和社会发展中发挥着重要作用。但该流域气候多样,地形复杂,观测资料匮乏,制约着该流域尤其是下游的水文研究。揭示该流域的水文特征及其对气候变化的响应,对流域水资源的合理利用和涉水灾害的有效应对有十分重要的意义。论文首先在NSR流域搭建了一个基于山坡产流机制的分布式水文模型GBHM-SW,利用ERA5再分析数据驱动模型重建了历史期的水文
结肠癌是具有高发病率和致死率的消化道癌症。治疗结肠癌的首选方案是外科手术治疗。但在中晚期结肠癌中,手术无法达到根治性切除,术后易于转移复发,降低治疗效果和患者生存期。寻找有效的针对结肠癌治疗的靶点是对结肠癌研究的重点方向之一。众所周知代谢重编程已成为癌症的一个主要特征。其中一种显著的代谢重编程特征是氮元素代谢的异常。本课题重点研究了谷氨酰胺代谢和尿素循环这两个重要的氮代谢过程在结肠癌中的改变和对结