满足本地差分隐私的数据分析关键技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jiangfan520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代信息技术的不断发展,包含敏感数据的个人信息的隐私问题也受到越来越多的关注,如何在保护个人敏感信息不被泄露的前提下进行数据发布和数据分析是当前面临的重大挑战。本地化差分隐私作为一种新的隐私保护模型,具有很强的隐私保护性。相比较中心化差分隐私,它不依赖于任何可信的第三方,在本地就对用户的敏感信息进行保护。它不仅可以抵御具有任何背景知识的攻击者,也可以防止任何不可信第三方的隐私攻击。在本地化差分隐私下,我们首先研究了一维密度估计问题,即如何在某一连续数值域下重构分布。现有的工作在进行分布估计时没有考虑关于整体数据的分布的先验知识,从而导致数据效用较低。我们提出了基于先验知识的增量式学习方法(Incremental learning method based on prior knowledge,IIMPK)来重构分布。该方法包含多轮收集过程,其主要思想是:首先在第一轮中,聚合服务器在没有任何先验知识的假设下对数据集中的部分用户的数据进行收集,并利用收集到的用户的信息来推断整个数据集的分布;然后从第二轮开始,聚合服务器考虑利用前几轮得到的样本分布作为整个数据集的分布的先验知识对本轮所要收集的用户数据进行处理,然后利用统计获得的数据信息进一步推断整个数据集的分布。我们设计了两种数据映射算法结合先验知识对要收集的数据进行转换,并设计了分布汇总算法对多轮收集结果进行集成。通过实验证明,我们的方案相对于现有方法,在为用户提供隐私保护的前提下,能够显著提高分布估计的精度。另外,我们针对离散域下的heavy hitter识别问题展开研究,该问题旨于找到较为频繁的项。我们分析了现有的解决算法,提出了优先队列方法(Priority queue method,PQM)来进行改进。该方法的主要思想是:通过引入优先队列的数据结构,从定长的数据中逐步识别出较为频繁的数据前缀,最终识别出完整数据的频繁项。我们通过实验对方案的有效性进行了验证,结果表明改进后的方案拥有更高的数据效用。
其他文献
甲烷(CH4)是仅次于二氧化碳的第二大温室气体,能直接或者间接影响全球气候。海洋是大气中CH4的源,其中近海占全球海洋CH4排放量的75%。渤海属于西太平洋的陆架边缘海,目前渤海的CH4研究主要集中在CH4的时空分布和海气通量及其影响机制等方面,季节性水体层化对CH4动力学过程的影响尚不清晰。针对该问题,本文以渤海中部为研究海域,基于对三个航次(2018年8月和2019年7-8月两个夏季航次和20
学位
压水堆核电站容积控制箱(容控箱)内部存在气液界面,在此界面上会发生气液传质。容控箱内的气液传质由淹没射流驱动,目前很少有对淹没射流驱动气液传质的研究。现有研究的气液传质主要由三种流动方式驱动,分别为明渠流动、网格震荡湍流和自然对流。本文构建容控箱内淹没射流驱动气液传质实验台,在1.3×105<.Re<2.5×106,135<Sc<580范围内开展实验,分别研究流体温度、入流流量、总压、射流直径和射
学位
在人工智能和大数据时代,数据隐私成为一个至关重要的问题。用户将私有数据移交给第三方服务器执行计算任务时,往往更为关注整个运算过程的隐私性。全同态加密(Fully homomorphic encryption,FHE)作为一种十分有前景的数据隐私保护技术,可以在密文数据上进行完整计算,从而保障用户的隐私。然而,同态加密中多项式的数据表示形式以及复杂的算法导致了计算量的急剧增加,这限制了将全同态加密技
学位
随着智能设备的应用普及、网络带宽的飞速增长、新型网络技术的迅猛发展,网络通信已成为数据通信系统的主体,而其中日益累计的海量数据也使我们步入了大数据的时代。Reed-Muller(RM)码作为一种信道编码,多应用于无线通信,特别是深空通信。由于它良好的理论性质和数学结构,RM码在理论计算机科学中也得到了广泛的研究。Barnes-Wall(BW)格是一类非常重要的格,构造BW格的一种方法是将Const
学位
近年来,纳米塑料作为一种新型污染物受到了国内外研究者的广泛关注。研究表明纳米塑料能够与有机物、重金属、工程纳米颗粒等环境污染物发生相互作用,使得纳米塑料成为其他污染物在海洋环境中的载体,改变污染物对水生生物的作用方式,进而可能导致更高的生态风险。然而,目前关于纳米塑料与重金属和工程纳米颗粒的联合毒性研究还处在起步阶段,在有限的研究中尚未得到规律性的结论。因此,有必要继续深入研究海洋环境中纳米塑料与
学位
在口译活动中,对于只掌握一方语言的听众而言,翻译的流利与否很大程度决定了听众对译员的信任。由于疫情防护需要,笔者在无实际翻译的情况下选择第五届老子文化论坛进行模拟中韩同传实践,模拟同传中笔者出现的停顿、反复和自我修正问题影响翻译整体效果,这些问题也是口译中较为典型的非流利现象。笔者决定针对这些非流利问题进行原因分析及对策探讨,以求日后能提升口译流畅度。笔者结合释意理论口译过程模型及吉尔同声传译认知
学位
为了更好地落实江汉油田全面从严治党要求、引领保障“万千百”战略目标实现,提出了做好查办案件“后半篇”文章的三项举措:压实四个责任,强化组织领导;坚持三个原则,提升整改实效;抓好五个环节,把握工作重点。
期刊
近年来我国海水养殖业发展迅猛,而养殖过程中产生了含有大量无机氮和有机物的废水,其未达标排放将严重破坏海洋生态环境。因此,保证海水养殖废水达标排放,己成为保护海洋生态环境,推动海水养殖业可持续发展的必然要求。电化学技术装置简单、处理效率高,在废水处理领域有广阔的应用前景。因此,本文基于双室电解池和单室电解池,采用电化学技术对海水养殖废水中的无机氮(硝酸盐氮NO3--N、氨氮NH4+-N和亚硝酸盐氮N
学位
牺牲阳极广泛用于海洋环境中工程装备的防腐,在某些海洋特殊工况中(如低温(4℃以下)、高温(50℃~70℃)、间浸、低盐海水(盐度低于15))现有阳极的电化学性能会显著降低,对工程装备的防护达不到理想效果。因此,本文首先对比研究了现有铝阳极(AZI阳极、Al-Zn-In-Cd阳极、Al-Zn-In-Mg-Ti阳极、AZMG 阳极)在上述海洋特殊工况中的电化学性能,并结合微观表征方法和电化学测试技术探
学位
海水的盐度是海洋研究中最重要的物理量之一,表征了溶解于海水中物质的总量。在洋流行为、海洋生物活动、海气相互作用中扮演着重要作用,对气候变化、海洋生态、海水养殖、深海潜航等方面有着重要影响。因此,海水的盐度测量有着重要意义。当前,海水盐度的测量主要采用基于电导率原理的温盐深仪(CTD),该方法通过测量海水的电导率、温度和压力,基于经验性公式计算得到海水的盐度信息。基于该方法得到的海水盐度是实用盐度,
学位