论文部分内容阅读
大数据时代,越来越多的用户通过互联网建立联系,形成了数据庞大且结构复杂的社交网络,为数据分析和数据挖掘研究提供强大信息资源的同时,也为网络攻击者提供了便捷。隐私保护技术能够阻止网络攻击者对目标节点实行重识别攻击,防止隐私信息被窃取。由于不同用户具有不同的隐私保护需求和偏好,这需要为其定义隐私保护需求,限定隐私信息的保护程度和使用方式,提供个性化的隐私保护。论文从社交网络的图结构和具体数据记录两方面,研究了个性化隐私保护技术。根据图结构的连接指纹信息(Connection Fingerprint,CFP),论文计算了节点的隐私保护需求度,用于标识节点的不同隐私保护偏好,同时结合多样性聚类(7)-diversity),研究了针对图结构信息的个性化隐私保护技术。社交网络中的节点存在的多种敏感属性,论文通过各个属性对应的继承分类树,计算节点和数据记录的个性化隐私保护需求度,研究了针对图节点数据记录的个性化隐私保护技术。论文详细分析了算法的设计思想和实现过程,采用标准数据集对其进行了实验对比,并将其应用于某医疗器械供应链系统,验证了技术的有效性和可用性。具体来讲,论文的主要工作有以下几个方面。(1)针对社交网络中的图结构信息,本文研究了一种基于7)-diversity的个性化隐私保护方法。该方法根据社交网络中私有节点的CFP为其设定个性化隐私保护需求度,并基于7)-diversity模型对私有节点进行聚类。同时,根据每个等价类的个性化隐私保护需求度,为其添加少量的虚拟结构,形成可发布的社交网络图。(2)针对社交网络图中节点形成的数据记录,本文研究了一种基于7)-diversity的多维敏感属性个性化隐私保护方法。该方法根据各个敏感属性的继承分类树,为每条数据记录设定个性化隐私保护需求度,并构造多维敏感属性记录集进行7)-diversity聚类,最终获得可发布的数据集。(3)针对本文研究的两种隐私保护方法,分别实现了相应的算法,并且从算法时间效率、数据损失率以及变化率等方面设计了大量对比实验,结果显示,这两种方法在达到隐私保护的同时确保了发布后社交网络数据的有效性。最后,将该两种方法应用于某医疗器械供应链系统,对由该系统形成的医疗器械供应链网络进行个性化隐私保护,在提升用户体验的同时保证了供应链网络的数据安全。