论文部分内容阅读
信息时代的迅速发展,使得越来越多的信息被共享。自由访问型微数据发布是当前科学研究和信息交换的有效手段,也为数据共享提供了平台。但是,随着数据挖掘技术的应用及搜索引擎功能的不断强大,自由访问型微数据发布中的隐私泄露问题也日益突出,隐私保护成为数据库安全的一个新的热点研究方向。传统的方法在应对该类型隐私泄露问题时,不仅不能有效地保护隐私,还造成了发布数据严重失真,使得数据的发布失去意义。K-匿名是微数据发布中防止隐私泄露的有效方法,其思想简单,易于实现,是当前隐私保护的流行模型,但是K-匿名模型也有其本身的局限。论文通过对K-匿名模型的深入研究,指出了K-匿名模型的不足,并提出了一种新的改进模型,该模型能够有效应对K-匿名模型的缺陷。论文的主要工作包括:
①基于前人对K-匿名的研究成果和解决方案,研究了K-匿名保护隐私的作用,重点分析了K-匿名在解决隐私保护属性泄露方面的缺陷,并通过进一步分析得出隐私保护的属性泄露过程中的属性保护度问题,指出不同的敏感属性在应对属性泄露时可以设置不同的保护强度,从而避免更多的信息损失。
②通过对当前解决隐私保护的K-匿名模型的缺点的分析,提出了保护隐私的(alp,dif)-个性匿名模型,该模型不仅可以有效处理K-匿名不能应对的属性泄露问题,还考虑了敏感属性值的保护度问题,最大限度地保证了准标识属性的有效性。为保证发布数据的可靠性,该模型采用泛化的方法对发布数据进行预处理,提出了基于信息泛化损失的贪婪泛化算法,泛化属性的选择不仅考虑信息损失的大小,并综合了泛化属性对敏感属性的重要性,两者的积作为最终选择泛化属性的标准。
③利用经典实验数据集对该模型进行验证,通过实验结果得出,保护隐私的(akp,dif)-个性匿名模型不仅能够解决K-匿名无法应对的发布数据属性泄露问题,同时在执行时间增加不多的条件下,保证了发布数据的有效性。