论文部分内容阅读
在现实生活中,数据发布者,如Facebook,往往会将社会网络发布出来。通过数据挖掘等技术手段,研究人员能够发掘隐藏于其中的价值规律。与此同时,社会网络所包含的用户隐私信息也会面临着威胁。因此,在社会网络发布过程中,保护用户身份隐私的安全性以及保证发布后社会网络的可用性变得非常重要。本文的研究重点是设计一种具有较好的安全性和可用性的隐私保护模型,其主要工作如下:首先,本文通过分析节点的度在社会网络分析领域中的重要程度,将原始社会网络模型化为无向图,并阐述系统模型的组成元素和工作流程。其次,本文假定了一种邻域关系身份隐私攻击模式。在邻域关系攻击模式下,攻击者能够获取目标节点的度数、其邻域节点间的关系以及邻域节点的度序列信息,作为自身的背景知识。通过对数据集中相似节点百分比进行验证分析,实验结果表明,本文所假定的邻域关系身份隐私攻击模式是可行的。然后,为了抵御邻域关系攻击,本文提出一种SSSA隐私保护模型。SSSA (Standardization, Similarity, Security and Availability)隐私保护模型确保原始社会网络图中任意节点至少与其他k-1个节点具有相似的邻域关系图结构,使得独立的“唯一性”节点聚集成由多个“相似性”节点组成的簇。在邻域关系攻击下,发布后社会网络图中任何节点被标识出的概率不高于1/k,保证节点具有较高的安全性;另一方面,适度地进行图形重构操作,保证发布后社会网络图具有较好的可用性。最后,本文以Cond_Mat、Hep_Hp、Enron和Facebook四种真实社会网络数据集为实验对象,从安全性和可用性两个方面进行验证分析。实验结果表明,本文提出的SSSA隐私保护模型不仅能够较好的保护用户身份隐私的信息,还可以保证发布后社会网络图具有一定的可用性。