论文部分内容阅读
随着移动互联网的飞速发展,社交网络已经成为人与人之间沟通交流的重要方式。越来越多的个体参与到社交网络活动中,形成了海量的个人和社会关系信息。这些信息蕴含着巨大的研究价值,但其中也包含许多敏感信息,例如网络边权重可以表示两个商业机构之间的接触频率或者交易价格。具有背景知识的攻击者通常会收集特定信息并通过数据挖掘技术进行分析来重新识别节点和连接等信息,导致敏感隐私信息的泄露,这样将会造成极其严重的后果。因此,社交网络数据在发布和共享前需要进行隐私保护处理,使得在不泄露隐私的情况下,发布具有数据挖掘和分析价值的社交网络数据。然而,现有的匿名化等隐私保护技术无法完全抵御具有强背景知识的隐私攻击,同时对于隐私保护处理后数据的可用性也相对不足。因此,本文旨在利用差分隐私技术来解决社交网络发布中存在的隐私泄露问题,同时提高所发布数据的可用性。本文对传统社交网络隐私保护技术研究现状进行了阐述,对社交网络差分隐私保护研究技术进行了归纳总结,基于可信第三方集中式系统架构,针对不同类型的社交网络,结合差分隐私技术,对社交网络发布的隐私保护关键技术进行研究。本文的主要工作如下:(1)针对权重社交网络发布过程中存在的边权重隐私泄露问题,结合差分隐私技术,提出了基于社区发现和离散小波变换的权重社交网络发布算法DWT-DP。该算法首先对社交网络进行社区划分来减小网络尺寸,使用离散小波变换对划分后的每一个社区的权重矩阵进行多分辨率分析。然后,对离散小波变换后每一层的高频细节矩阵和最后一层的低频近似矩阵自适应的分配隐私预算并添加拉普拉斯噪声,再重构权重矩阵。最后,将社区进行连接并发布隐私保护处理后的社交网络。(2)针对动态社交网络演化和发布中社交关系隐私泄漏问题,结合差分隐私技术,提出了基于差分隐私的动态社交网络发布算法DP-DSNP。该算法首先针对动态社交网络进行动态社区发现,然后使用Jaccard相关系数来追踪社区的演化,对于发生演化的社区转换成邻接矩阵并进行选择性差分隐私扰动,而对于未发生演化的社区则保留上一时刻网络图的扰动方式,最后,将社区进行动态连接生成完整的社交网络并进行发布。(3)为了验证权重社交网络发布算法DWT-DP和动态社交网络发布算法DP-DSNP的有效性,分别对这两种算法进行了理论分析,包括时间复杂度分析、隐私性分析和效用性分析等,分析结果表明,两种算法均满足差分隐私保护并且具有较好的执行效率;同时,采用节点度分布、加权聚类系数和平均聚类系数等社交网络重要指标在真实社交网络数据集上进行实验验证,并与privHRG隐私保护算法进行对比实验。实验结果表明,两种算法在满足隐私保护需求的同时,保留了较好的网络特性并具备较高的数据效用。