论文部分内容阅读
随着智能终端设备以及5G网络技术的迅速发展,基于地理位置服务的相关应用已经广泛使用到社会生活生产的各个领域。通过对用户上传的共享数据进行相关建模,用户在使用加载模型后的应用的过程中能够为其带来许多便利。但是随着人们个人隐私保护意识的加强,如何保障位置数据中的敏感信息免受恶意的侵犯已成为一个迫切需要解决的问题。差分隐私能够解决传统隐私保护力度不足的问题,差分隐私通过数学定量分析隐私风险程度,以及在发布结果中添加随机噪声,使得整个数据集的相关统计特征没有多大影响,攻击者无法通过发布后的数据反推出个体的用户信息。基于差分隐私的数据发布形式多为直方图形式,在对直方图进行区间查询时,区间跨度过长会导致累积噪声过大从而会降低发布数据的可用性,本文研究优化区间分组来达到提升发布数据的可用性。本文研究内容如下:(1)添加拉普拉斯噪声是差分隐私的标准方法,在发布数值数据之前对其数据先进行随机扰动,拉普拉斯机制目前被作为差分隐私的最基本方法被广为使用,然而并没用对拉普拉斯机制进行优化的相关研究工作。本文介绍了一种可以替代Laplace的方法——阶梯分段分布机制,在给定相同隐私预算的条件下,使用该机制运行时间明显降低,性能上得到有效提升。(2)本文以静态轨迹数据集为研究对象,提出了一种基于阶梯分布的差分隐私直方图发布算法DPHR。为了提高组内相似度,设计了充分考虑计数距离和方位距离的估分函数,并以此估分函数对初始数据使用满足差分隐私的指数机制进行排序,然后对排序后的直方图进行聚类分组,在不给定分组个数的情况下,以降低整体误差为原则进行贪心聚类分组,对聚类后的分组添加阶梯分布机制产生的随机噪声,并用差分隐私理论证明了该方法满足差分隐私定义,最后在两个数据集上进行了仿真对比实验,实验结果表明该算法具有较高的数据可用性。