论文部分内容阅读
随着互联网与信息化技术的迅速发展,社会网络已逐渐引起人们的高度注意。通过对社会网络的研究,人们可以理解社会现象,预测人类行为,为社会结构的分析提供了极大地便利。但随着对社会网络研究给人们带来便利的同时,越来越多的社会网络数据被发布到网络上,这其中可能包含人们的一些隐私信息,攻击者可以利用他们现有的背景知识,窃取网络上个人的隐私资料,从而导致用户隐私信息的泄露。所以在利用社会网络进行分析的同时,保护用户隐私不被泄露成为了人们越来越关注的问题。目前,基于社会网络的隐私保护方法,主要分为两大类:一类是基于聚类的社会网络隐私保护方法;另一类是图修改的社会网络隐私保护方法。这两类方法中对攻击者的背景知识进行了假设,可以归纳为以下几种:识别顶点属性、顶点度、链接关系、邻居结构、嵌入子图。而目前还没有对攻击者同时具有顶点度和边上权值的背景知识进行研究。基于此,本文假设攻击者同时具有顶点度和边上权值的背景知识,对社会网络数据的隐私保护问题进行了重点研究。首先,本文根据社会网络具有“小世界”现象和幂律分布现象的特点,对社会网络中相似的顶点进行聚类。对相似顶点聚类之后,可以使得接下来的匿名操作对原图的修改大大降低。对于相似顶点的判断,本文给出了顶点的匿名信息缺失度量方法。利用该方法判断两个顶点之间的相似程度,由用户定义每个聚类中所包含的最少顶点数K,取相似程度最近的K个顶点组成一个聚类。然后,针对聚类中各顶点的度和边的权值信息进行匿名,以满足社会网络图k-匿名的要求。由于聚类中各顶点的度以及边上的权值有一定的差异,匿名时为了保证尽可能少的信息缺失,要尽量小的修改原图信息。本文提出了一种等值边匹配的方法,通过对聚类中相等边建立匹配关系,在匿名时对于匹配数量多的边尽量不进行修改,从而有效降低匿名带来的信息缺失。对顶点度的匿名主要通过添加边的操作,对边上的权值匿名主要通过修改原边上的权值和赋予新边的权值。最后,在基于真实数据集上的大量实验测试结果中,表明了本文提出的社会网络隐私保护方法不仅有效的降低了匿名信息缺失,而且能够有效地保护用户的个人隐私。