论文部分内容阅读
Web技术的进步,使得社会网络(比如facebook(facebook.com)、 twitter(Twitter. com)、myspace(myspace.com)、hi5(hi5.com)等)得到了快速的发展,社会网络的快速发展也给人们的交流带了来极大的方便。然而,社会网络中含有大量的个体隐私信息,其发布和共享会对个体的隐私构成威胁。因此,研究社会网络中的隐私保护问题具有重要的现实意义。社会网络的隐私保护技术中,匿名化方法以其安全、有效成为目前该领域的研究热点。匿名化方法的思想是通过对原始社会网络进行某种变形变换,从而保护存在于社会网络中的个体隐私。现有的社会网络隐私保护方法大多是针对社会网络中的个体,不能有效地保护社会网络中的敏感关系。本文从匿名化模型及算法两个方面,对含敏感关系社会网络发布中的隐私保护问题进行了研究,主要工作有:(1)提出l-敏感边匿名模型,实现了对含敏感关系社会网络中敏感关系的有效保护。现有的敏感关系保护的方法是通过删除敏感边实现的,该方法使网络的变形大,匿名网络的可用性差。为此,本文提出了一种l-敏感边匿名模型,该模型要求每个含敏感关系结点的敏感关系至少为l个,使攻击者确定地标识出个体间敏感关系概率不高于1/l,从而保护了个体隐私。实验表明,l-敏感边匿名模型与删除敏感边的方法相比,在保护敏感关系的同时,能够更好地保持匿名网络的可用性。(2)提出(k,l)-匿名模型,在l-敏感边匿名模型的基础上,增加了度匿名化约束,从而保护敏感关系的同时,抵制了度攻击。现有的针对敏感边隐私保护的(k,2)-匿名发布方法可以抵制邻域攻击,不能抵制度攻击。为此,本文提出(k,l)-匿名模型,该模型要求每个含敏感关系结点的敏感关系至少有l个,且要求度相同的结点至少有k个,从而在保护敏感关系的同时,抵制了度攻击。论文也提出了实现(k,l)-匿名模型的匿名化算法。实验表明,在k和l满足用户需求的情况下,(k,l)-模型可以在保护个体间的敏感关系和抵制度攻击的同时,有效地保持匿名网络的可用性。(3)提出(k,l,m)-匿名模型,实现了社会网络敏感关系及结点敏感属性的有效保护。现有的敏感关系匿名模型无法保护网络中属性中的敏感信息。为此,本文提出(k,l,m)-匿名模型,该模型在(k,l)-匿名模型的基础上,添加敏感属性的泄密约束,要求在满足(k,l)-匿名的等价类中,结点的敏感属性值满足m-多样性约束;并基于加权层次距离,提出实现(k,l,m)-匿名模型的(k,l,m)-聚类算法以及信息损失的度量方法。实验表明,对于结点带有属性的含敏感关系社会网络,(k,l,m)-匿名模型可以有效地保护网络中的敏感属性和敏感关系。