论文部分内容阅读
随着数据库应用的发展,人们越来越关注数据库的安全,特别是当数据库应用中涉及到与人们切身利益相关的隐私信息时。在数据发布这一应用中,数据是直接对外公布的,因此隐私保护更为困难。目前的数据发布隐私保护技术的研究多集中于两点:一个是为了保证发布数据的安全,数据需要遵守的原则和标准,另一个是使得发布数据达到该原则的方法。本文即是针对数据发布中存在的隐私信息泄露问题,研究数据发布的隐私保护技术。本文的主要研究工作如下:首先,总结分析了数据发布的隐私保护技术中最主要的匿名技术,包括经典的匿名原则和匿名原则的新发展。其次,研究针对数值型敏感属性的隐私保护技术,提出了基于敏感值平稳发展的(Δt,e)-匿名原则以抵御近似猜测攻击,以及最大限度满足匿名原则的等价组划分算法。第三,针对匿名表中少部分不符合平稳发展匿名原则的等价组,我们提出了缩放的思想对等价组中不“好”的敏感值进行修改。在选取了适当的缩放参数、缩放对象和缩放方法的情况下,经过缩放的等价组内的敏感值能够满足(Δt,e)-匿名原则,同时不易被攻击者反推,即隐私保护性能较好。本文通过对基于泛化、排序和缩放所得到的匿名表在查询统计表现上的比较,证明缩放的方法得到的数据表可用性亦较好。并在此基础上,提出了数据可用性更好地适用于较可信受众的数据发布方法。最后,对算法做出了实现,并对比分析了本文缩放算法和排序、泛化各自得到匿名表的数据可用性。然后分析了本文算法的时间复杂度和隐私保护度,证明了本文方法的可行性。