基于差分隐私的动态数据发布方法研究

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:HalfHour
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
差分隐私由于其严格的数学证明和强大的隐私保护,现在已成为数据发布隐私保护的一个标准。近几年,许多基于差分隐私的数据发布方法被提出,但是大部分方法都集中在静态数据发布方面,对于动态数据发布的研究还相对较少。另外,在基于差分隐私的动态数据发布中,隐私预算作为衡量隐私保护程度的指标,如何合理分配有限的隐私预算到每个发布数据的时间点上,对于提高差分隐私动态数据发布的效用至关重要。因此,在满足差分隐私的情况下提出新的动态数据发布算法并对有限的隐私预算进行合理分配,成为基于差分隐私的动态数据发布的主要研究问题。为了解决以上问题,本文提出以下两种算法:(1)提出一种新的差分隐私动态数据发布方法:基于KL(Kullback-Leibler)散度的贪心分组算法(Greed Group Algorithm Based on KL-Divergence,GGA)。该算法首先利用KL散度来计算相邻两个时间点上数据的差异,然后通过比较噪声KL散度与噪声阈值的大小来对数据进行发布。同时,在文中还给出了GGA算法的隐私分析与证明。另外,GGA算法在数据发布过程中还采用了三种数据发布策略,其中贪心分组发布策略能够有效降低全局敏感度,提高数据的发布效用。最后,在真实的数据集上对GGA算法进行了实验验证,实验结果表明:在满足差分隐私的条件下,相比于现有差分隐私动态数据发布算法,GGA算法能够提高数据发布的可用性,对数据进行更有效地发布。(2)提出一种基于强化学习的差分隐私动态数据发布算法(Dynamic Data Publishing Algorithm Based on Reinforcement Learning,DDPA)。该算法在满足差分隐私的条件下,将强化学习的思想与动态数据的变化特点相结合,利用马尔可夫决策过程对隐私预算的分配问题进行了形式化建模,并在动态数据发布过程中找到了一种合理的隐私预算分配方案。另外,本文还提出了一种与现有数据发布方式不同的动态数据发布策略。最后在真实数据集上对DDPA算法进行了实验验证,实验结果表明:基于强化学习的差分隐私动态数据发布算法可以在动态数据发布过程中对有限的隐私预算进行合理的分配,并结合新的数据发布策略,提高动态数据发布的可用性。
其他文献
富勒烯发现至今只有短短20年时间,由于其独特的结构和物理、化学性质,吸引了众多科学家的目光,因此在这20年中,使得C60化学得到了很大的发展.文章综述了C60的结构、性质和用
传统市场中的同质化竞争已经演绎到网络市场,从苏宁、京东、国美的电商大战到淘宝、当当、卓越的"双11"大战,让消费者切身体会到了网络市场的影响力与魅力。随着电子商务的快
<正>近年来,溶栓疗法已经成为治疗急性缺血性脑卒中最有前途的方法之一。动脉内介入溶栓以其较高的再通率和良好的疗效,已越来越得到了广大临床医师的认同,并使越来越多的患
本系统为"建筑施工非传统水源回收利用综合系统",通过对建筑施工现场非传统水源的回收、处理再利用,满足施工现场各种用水需求。
通过采用PKPM-SAUSAGE软件对三个剪力墙上部不同程度中断模型进行动力弹塑性时程分析,得出剪力墙不同中断的程度以及楼层侧向刚度变化对结构抗震性能的影响,并用于实际工程设
针对传统的奇异数据识别和修正方法对数据处理粗糙,难以精确处理奇异数据的缺点,提出了一种基于小波分析的奇异数据识别及修正方法,该方法利用小波分析在时域和频域同时具有
本论文从语用学的角度对否定与禅宗机缘性会话中的遮诠现象进行研究。机缘性会话为禅宗师徒之间展开的问答形式的对话,旨在引导弟子开悟。首先在以往的研究中,遮诠主要是从哲
近年来,新“被”字结构如雨后春笋般大量出现在网络和报刊杂志中。自2008年“被自杀”流行之后,“被就业”“被自愿”“被小康”“被67%”这类新颖、简洁的新兴“被”字结构
电子商务已成为21世纪的主流商务模式,打破了传统贸易形式的时间和空间限制,使企业与消费者、合作伙伴及供应商之间的沟通和交流得到极大的增强,加速了全球信息经济一体化的
生育意愿是人们生育观念的直接体现,很大程度上决定着人们的生育行为。随着我国经济的快速发展,越来越多的农民工进入城市,他们在城市当中的生活方式和工作情况备受学术界关