基于GAN的社交网络隐私保护方法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:whtdongwht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网和移动通信技术的发展日新月异,在线社交网络(OSN)的引入改变了人们相互联系和互动以及共享信息的方式,导致了以网络为中心的数据大爆炸,这些数据可以被收集以更好地利用,如个人或群体的社会学和行为学方面。因此,在线社交网络服务运营商被迫公布社交网络数据,以供诸如研究人员和广告商之类的第三方消费者使用。由于社交网络数据发布易受各种重识别和泄露攻击,开发隐私保护机制是一个活跃的研究领域,不仅要实现社交网络图结构数据的安全发布共享,而且还不能影响社交网络分析的数据可用性。目前的研究主要集中在以统计方式通过常规匿名技术的组合发布扰动的社交网络数据,而没有考虑全局图结构信息。本文结合差分隐私和生成对抗网,发布社交网络数据的生成版本。生成对抗网及其扩展使用两个玩家的最小-最大游戏,用于生成具有不可区分特征的合成数据,而差分隐私以不同的隐私方式满足隐私约束,两者的结合实现了隐私保护和数据效用之间的折中。本文的主要工作如下:(1)针对社交网络服务提供商发布数据时所存在的敏感信息泄露问题,本文基于生成对抗网络,提出了一种保护社交网络数据隐私安全的方法(GPGAN)。首先,使用GAN作为机器学习模型捕获网络结构特征,并通过设计奖励函数指引建立包含关键信息的随机游走。随后,设计了基于游走样本的匿名图构建算法,可以利用添加差分隐私信息得到的匿名概率邻接矩阵来重建社交网络图。实验结果显示,与其他图生成方法比较,该模型更具备了优秀的图结构学习能力。而通过度量评估实验,证明了GPGAN可以通过合理的隐私预算保持所需的数据效用,最后与传统的K匿名和差分隐私方法相比,表明了本文方法在权衡数据效用和隐私保护方面的优越性。(2)针对应用于社交网络中的基于差分隐私的GAN模型优化问题,提出了基于Net GAN的差分私有图发布模型(Priv-Net GAN),实现了生成高质量图结构数据的同时保证所需的隐私安全目的。首先,在Priv-Net GAN模型中,将精心设计的噪声与训练梯度相结合,以扰乱原始数据的分布,并在理论证明了该模型符合(ε,δ)-差分隐私。其次,训练中使用了判别器优化器,实现了梯度估计和裁剪,控制了隐私级别,显著提高了模型的稳定性。最后,通过在三个真实数据集上的实验,评估了Priv-Net GAN模型。结果表明,在合理的隐私预算下,Priv-Net GAN可以生成隐私得到充分保护的高质量数据,通过对比同类差分私有图验证了Priv-Net GAN模型的隐私保护效果;通过常用的图统计指标来比较生成图和原始图的数据效用,证明了Priv-Net GAN生成了高质量的社交网络数据。
其他文献
数字图像已经在日常生活中被广泛使用,但是也面临着信息泄漏和侵犯版权等问题,因此数字图像保护技术应运而生。作为两种重要的图像保护技术,数字图像加密技术和数字图像水印技术已经成为研究热点。近年来,数字图像加密技术的研究大部分都是基于简单、低维的混沌系统,安全性不足;而数字图像水印技术则大部分是在水印嵌入算法上作出改进,忽略了水印系统的安全性。本文针对数字图像保护技术中的问题进行了研究,提出了基于高维复
学位
植物叶片病害识别是农业和图像处理领域共同关注的重要课题。目前大多数病害识别的研究都基于神经网络,而成功的神经网络包含较多的参数,使用有监督的神经网络模型进行叶片病害识别需要充足的样本进行训练。而在现实生活中,由于标记样本的代价较高或病害发病率较低等因素,往往得不到充足的训练数据,这是目前植物病害识别研究的一个普遍挑战。因此,需要寻找一种能够生成病害图像的数据增强方法,解决训练样本不充足问题,以满足
学位
行人再识别技术作为计算机视觉领域的重要研究课题,它可以形象地理解为在不同的监控摄像头下检索相同的行人。随着互联网的高速发展,监控网络渐渐覆盖到生活的方方面面,大量的图片数据需要处理,由此行人再识别技术被人们广泛关注。尽管目前行人再识别性能有所提高,但现有的方法通常依赖于这样一个假设,即要查询的人和图库图像都拥有相同的服装。虽然这个假设确实适用于许多现有的Re-ID数据集,但如果数据经过很长时间的聚
学位
肺癌是当今世界死亡率最高的癌症,如果能够在肺癌发生的早期发现并及时治疗,可以明显降低肺癌死亡率。利用图像分割技术对患者肺部CT图像中发生病变的区域进行精准分割,可以提高肺癌早期诊断率。传统图像分割方法分割精度低且需要大量人工操作。近年来分割精度更高且特征表征能力更强的深度神经网络在图像分割领域得到了广泛应用。因此,本文以U-Net和3D U-Net网络这两种深度学习方法为基础展开研究。主要贡献如下
学位
注意缺陷多动障碍(Attention-Deficit Hyperactivity Disorder,ADHD)是最常见的神经发育障碍之一。尽管症状通常开始于儿童时期,但有大部分的患者在成年期也会受到影响,表现出持续存在的社会功能问题、较低的学术成就和较高的精神问题风险。ADHD作为一种神经发育性疾病很难对其症状进行界定,但通常伴随着脑网络的改变,通过研究ADHD脑网络可以探索其发病机制。结构脑网络
学位
利用磁共振影像数据对脑网络进行表征是目前研究脑精神疾病分析的一种先进技术。以往的脑网络研究主要集中在图上,研究者们将脑网络与人工智能领域中应用较广泛的传统的机器学习与深度学习等计算机技术结合起来,对脑网络进行特征提取与选择、分类等工作。然而近几年的研究表明,大脑认知机制涉及多个大脑区域间的相互作用,而不是成对间的相互作用,为有效表征大脑之间信息的高阶传递关系,超图被提出用来描述脑网络。在以脑区为节
学位
针对目前既是小曲线半径又是大坡度的桥梁转体施工研究不多现状,依托新建广州至湛江高速铁路工程广珠京广联络线特大桥(52+52)m转体梁施工项目,结合该桥为目前国内最小曲率半径(仅310 m)、坡度最大(纵坡达20‰)的T构转体桥,梁体上跨环镇东路、京广三线联4线、机走线等多条城市道路和铁路线路,转体过程中梁底与接触网立柱柱顶隔离开关距离仅有30 cm等不利条件,阐述了该转体桥的称重、配重、转体结构施
期刊
精神分裂症(schizophrenia,SZ)和双相情感障碍(bipolar disorder,BD)都是一种很常见的精神疾病,不仅影响患者的生活,也影响了别人的生活。但是两者的患病机制都不十分明确,并且在临床诊断上也没有严格的分界线。因此不断探索SZ和BD患者的患病机制以及两者之间的不同,为疾病的诊断和干预提供新的手段至关重要。越来越多的研究表明,神经疾病是大脑的连接障碍造成的,大脑区域之间复杂
学位
新药物的开发是一个耗时耗力的过程,且新开发的药物实际利用率较低,造成了资源的浪费,因此,研究者们提出了药物重定位的思路,探索已上市的药物对于其他疾病的治疗效果,从而实现“旧药新用”。药物-疾病关联预测是药物重定位中的一项重要研究,该研究将药物和疾病的高通量数据作为输入,结合计算方法预测药物-疾病的潜在关联,能够为药物的高效研发和疾病的低成本治疗提供辅助性建议。现有的药物-疾病关联预测方法大多将药物
学位
深度神经网络已经广泛应用于包括医学图像分析在内的各种计算机视觉任务中。通常,大多数神经网络对来自相同分布的图像进行训练和评估,且假设数据集(训练集和测试集)共享相同的数据分布,但现有医学数据受固有的小数据集的影响,限制了大型深度学习模型的广泛临床采用。随着深度学习的深入,现实世界中研究的课题往往考虑收集具有不同场景分布的目标数据,但数据间的异质性严重受到领域转移的挑战。领域转移,即训练和测试数据特
学位