论文部分内容阅读
随着用户对基于位置服务(Location Based Service,LBS)隐私安全的日益关注,位置隐私保护成为当前研究的热点。但传统方法只针对快照单次查询或时空临近的连续多次匿名查询进行隐私保护,并未考虑基于大时空尺度范围匿名集的分析推理攻击。为验证这一问题,本文主要进行了以下研究:(1)通过对相关文献的理论分析研究,首次提出了传统的时空K-匿名及其变体方法可能存在不能有效防御基于大时空尺度范围匿名集的分析推理攻击问题,为此,设计并开发了从GPS轨迹数据模拟生成LBS时空K-匿名实验数据的软件系统。本文的研究对象是LBS在时空K-匿名查询过程中产生的系列匿名集数据。但目前时空K-匿名及其优化方法并没有在商业的LBS系统上得以大规模推广应用,因此我们采用对GPS轨迹数据进行预处理,并应用Gruteser等人提出的时空K-匿名算法,实验模拟生成一定规模数量的匿名集数据。本实验的GPS轨迹数据,取自南京市某出租车管理公司于2007年7月15日,收集的(0:00-24:00)时段的2612辆出租车的GPS轨迹数据。实验模拟生成的匿名集数据包括:LBS快照查询生成的匿名集,LBS连续查询生成的匿名集。(2)首先设计了具体的针对时空K-匿名查询数据集的关联规则挖掘方法与序列模式挖掘算法实现方案。然后利用提出的这两种实现方案,以从大量GPS数据模拟生成的匿名集快照数据与匿名集序列数据为实验数据,分别进行了匿名集数据的关联规则挖掘与序列模式挖掘的实验。实验结果表明:基于本文提出方法挖掘的匿名集数据关联规则和序列模式,可对涉及敏感时空区域的用户的隐私进行推理攻击,从而产生更具威胁性的隐私暴露风险。(3)首次提出了通过对隐私敏感的关联规则和序列模式进行动态的分析,在可信服务器上设计优化的时空K-匿名隐私保护方法,以实现LBS位置隐私的严格保护的基本思路。本论文研究成果对于实现LBS位置隐私的增强性保护研究具有重要的实践价值,对于丰富隐私保护数据挖掘领域的研究内容具有一定的理论价值。