论文部分内容阅读
随着信息技术的发展,社交网络用户数量越来越多。用户可以很方便地在社交网络上交流,互动,分享信息。与此同时,社交网络用户的信息被各大社交网络平台记录和收集。为了更好地给人们提供个性化和有针对性的服务,社交网络数据通常被发布给第三方,进行数据挖掘与分析。然而发布的数据中包含了用户的隐私信息。恶意的攻击者,可以通过已掌握的背景知识,对发布的社交网络数据进行重识别和解匿名,从而造成用户的隐私泄露。因此社交网络数据在发布之前,需要做匿名处理,使得发布的数据,满足隐私保护强度的需求得同时,保持数据的可用性,用于数据分析。因此本文研究了基于k-匿名的社交网络数据发布的隐私保护技术。本文主要工作包括:(1)介绍了社交网络数据发布的研究背景及意义,分析了目前社交网络数据发布隐私泄露的情况以及社交网络隐私保护技术的发展情况,并综述了国内外针对社交网络数据发布隐私保护技术的研究现状。对社交网络相关的理论和隐私保护技术进行了归纳总结,并探讨了社交网络常用的隐私保护方法与技术。(2)针对随机化技术对社交网络图的修改较多,容易造成匿名后的数据效用急剧降低的问题,将社区划分引入到随机化技术中,提出一种改进的k度匿名隐私保护方法k-subgraph。利用社区划分步骤,约束了随机扰乱范围,保护了原始数据的图特征结构。实验表明,与KDLD算法和PK(partial k-anonymity)算法相比,ksubgraph算法信息损失率更小,平均路径长度,节点平均度更稳定。(3)针对现有的社交网络属性隐私保护算法对所有属性采用同等力度隐私保护,容易造成过度匿名的问题,进入节点影响力分析,提出一种基于节点划分的社交网络属性个性化隐私保护方法D-KDLD。该方法根据节点影响力,将节点划分为关键节点和边缘节点,分别采用数据泛化和节点分割的方式隐匿属性信息。实验结果表明,D-KDLD方法相比其他检测方法有更少的信息损失量。本文的创新之处包括:(1)提出一种改进的k度匿名隐私保护方法。该方法通过社区划分,约束随机扰乱的范围,保护了数据的图特征结构,从而提高了匿名后的数据效用。(2)提出一种基于节点划分的社交网络属性个性化隐私保护方法。该方法根据节点的影响力,将节点划分为关键节点与边缘节点,采用差异化方式匿名属性信息,减少了数据信息损失量。