论文部分内容阅读
目前,关于社会网络数据发布的隐私保护算法都属于无差别的隐私保护方法,导致对部分用户的数据造成过高的隐私保护,失去了用户分享信息的原始意图,同时也降低了社会网络数据的可用性;大部分隐私保护技术主要基于静态社会网络数据的发布,攻击者可以通过社会网络的变化过程获取社会网络的隐私信息,造成用户隐私泄漏;在社会网络中,用户也会拥有自己的敏感属性值,例如薪资情况、社区属性等;对于某些社会网络,如果保留敏感边的权值信息,可以更好地体现社会网络的特性,减小网络数据损失。针对上述问题,课题从匿名技术的角度对社会网络中数据进行隐私保护研究。首先对社会网络的隐私保护研究现状进行概述,包括社会网络的隐私信息类型、攻击方式、匿名化原则、匿名化方法以及主流匿名模型等。针对社会网络的三种抽象模型,对现有的隐私保护方法进行分析,并引入个性化思想,设计出一种基于动态社会网络模型的个性化隐私保护方法和一种基于加权社会网络模型的个性化隐私保护方法。在动态社会网络数据发布中,将社会网络中的隐私保护需求划分为3个等级,同时为社会网络中的敏感属性C(结点所属社区)和敏感边提供隐私保护。通过(k,△d)-匿名算法以及邻域子图k-匿名算法对结点进行匿名处理。实验结果表明,相对于(k,△d)-匿名和邻域子图k-匿名算法,个性化匿名算法的执行效率更高,对数据造成的损失更小,但是在某些情况下波动幅度较大,不过总体趋势仍然优越于另外两种算法。在加权社会网络数据发布中,将社会网络中的隐私保护需求划分为3个级别,通过k-度分组和修改权重包对结点进行匿名,使得每个分组中的权重包满足k-匿名,敏感属性满足l-多样性。实验结果表明,个性化匿名算法比k-直方匿名算法和KH-inv-LD匿名算法的执行效率更高,信息损失更小;随着k值的增大,个性化匿名算法的优越性更明显;随着l值的增大,执行时间不断增长,且增长比率也在增大。无论是动态社会网络还是加权社会网络,个性化匿名算法与其他匿名算法相比,不仅实现了用户对隐私的保护需求,提高了算法的执行效率,同时降低了社会网络原始数据的损失,提高了数据的有效性。