基于差分隐私的位置信息隐私保护研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:wsz2228507
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球定位系统和无线通信网络的迅速发展,基于位置信息的服务逐渐深入到人们的生活中。通过对这些数据进行统计分析,可以给人们的生活带来巨大便利。例如实时导航、路况分析、个性化推荐等。但与此同时,也可能会造成用户隐私泄漏。因此,在发布位置信息的同时,需要对这些数据提供隐私保护。差分隐私作为一种强健的隐私保护模型,将其应用于位置信息的隐私保护中,通过对空间数据进行分割,以一种满足差分隐私保护的方式向分割后的每个子区域添加噪声,来确保个体信息在响应范围查询时不会被泄露。但由于数据分布特征和噪声的添加,使得查询结果存在一定误差,影响数据的可用性。为了提高数据发布结果的可用性,本文提出了两种基于差分隐私的位置数据发布方案:(1)基于k-d树的差分隐私位置数据发布方法。本方案对自适应网格划分方法AG算法得到的划分结果进行后置处理,根据待划分区域的数据分布均匀程度启发式的选择划分方案,利用k-d树索引结构自上而下的重新划分数据区域。本文使用一个类似于熵的度量函数Ic来描述待划分区域的数据分布均匀程度,并根据区域内数据分布情况自适应的设定一个阈值,启发式地生成均匀或接近均匀的子区域,避免了 AG算法局部区域划分过细导致的噪声叠加问题,减少了查询误差。(2)自上而下的划分方式,对数据分布特征的利用不够充分,当数据在小范围内分布比较集中时,划分后区域内部的数据分布均匀程度较低,还有进一步优化的空间。因此提出一种自下而上的数据归并方案——基于差分隐私K-means的位置数据发布方法。该方案的基本思想是首先对数据集进行细粒度的划分,得到一系列单元格,然后基于数据点个数将单元格划分为不同的聚簇,最后根据连通性原则将属于同一簇的相邻单元格进行合并,得到许多不规则区块,将归并后的区块作为数据发布的基本单位,用来响应计数查询。(3)最后,本文针对以上方案基于真实的位置数据集进行了仿真实验,实验结果表明两种方案较AG算法在一定程度上提高了查询准确度,而基于差分隐私K-means的位置数据发布方法更适用于数据分布不均匀、查询范围较小的情况。本文共使用图26幅,表16个,参考文献52篇。
其他文献
作为世界上已知最高大的竹种——巨龙竹(Dendrocalamus sinicus)具有极高的生态、经济、观赏价值。但在其自然分布区,巨龙竹秆形存在两种明显的变异类型,即“通直型”和“弯
本文对竹莱赛尔纤维的特性进行了简要介绍,重点介绍了其在水刺面膜产品中的应用。通过将竹莱赛尔纤维的面膜基布与铜氨纤维面膜基布的力学性能、吸水能力、柔软性能等进行对比
随着电力系统运行环境的不断变化,加之新能源发电的快速发展,导致系统随机性不断地增强,尤其是以光伏发电为代表的分布式电源大规模接入电网中,使得电力系统的状态更加复杂多
在当前知识经济的时代背景下,知识型员工是企业获取核心竞争力的关键。本文以知识型员工基本概述为基础,对企业知识型员工的激励机制中的问题以及原因所在做一个简要分析。最
前言白鹤岭滑坡位于长杭线的长兴至湖州之间。在白鹤岭车站以南约600m的线路左侧山坡。经最近勘测查明,该处存在两个不连续的滑坡。1号滑坡:DK203+930~DK204+080,线路切割滑
从含有大量纤维素物质的堆肥里利用刚果红染色法分离到一株土曲霉,命名为Aspergillus terreus M11。并对其液体和固体发酵参数以及这两种发酵方式下所产纤维素酶的性质进行了
08版《日出》的导演和主要演员充分发挥再创作的作用,对曹禺先生的原始剧本做出了大刀阔斧的调整,主要体现为以下三方面的突破:加入陈白露灵魂叙事的戏中戏结构;对陈白露这个人物
基于Andrews和Philips的经典漂移方差模型,结合部分相干艾里光的交叉谱密度函数和Tatarskii功率谱,推导出部分相干艾里光在大气中传输时的光束扩展和漂移解析式,对比分析了不
依据无狭缝摄谱仪获得的青海地区一次地闪回击过程的光谱,分析了NI 4935 ?谱线的Stark加宽效应,得到加宽在15~25 ?左右,通道不同位置的谱线两边显示出稍有一些不对称性;结合St
折褶滤芯在基础工业及军事领域中都有着广泛的应用。以一种全新的视角分析V形、U形、矩形和梯形折褶滤网,将研究范围深入到微观,推导出了4种折褶滤网的总压力损失计算公式。