基于局部差分隐私的关联数据发布保护

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:ty20011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
局部差分隐私是隐私保护数据发布领域中最强大的隐私保证模型之一。然而,该模型目前主要用于单属性数据采集,关于多属性关联的数据发布研究很少。此外,当数据属性值在数据发布中独立扰动时,可能会导致过多的信息损失。因此,基于局部差分隐私的关联数据发布保护研究已成为一个需要解决的迫切问题。首先,针对隐私保护数据发布中属性间关联性被忽略的问题,本文提出构造κ-度私有贝叶斯网络的算法。该算法将互信息与贪婪算法相结合以构造具有最大互信息属性对的κ-度私有贝叶斯网络,并利用贝叶斯网络来提供属性间关联性的直观模型。具体地,通过互信息来量化属性间的关联强弱,并在尼值的限制下贪婪的选择最大的互信息属性对以构造低度贝叶斯网络模型。其次,针对数据发布中属性独立扰动时信息损失过多的问题,本文提出一种用于关联数据扰动的局部差分私有方法。该方法结合属性分组思想和随机响应技术,以实现对原始数据集的扰动。具体地,本文采取基于属性对最大平均互信息值的分组思想,该思想通过计算κ-度私有贝叶斯网络父子节点间的平均互信息作为当前属性组的互信息值。接着,设定阈值,将整个贝叶斯网络的属性分为两个类别,即,弱关联属性集和健壮的关联属性集。然后,本文采取二次扰动的随机响应技术来构造扰动矩阵,针对弱或健壮的关联属性集添加符合不同隐私预算的扰动噪音,以确保局部差异隐私。进而,使用噪声边缘和贝叶斯网络来构造给定数据集的近似分布,以实现基于局部差分隐私的关联数据发布。最后,本文采取UCI开源数据集Adult进行试验,并通过多种度量标准来评估本文方法的效用,包括扰动前后数据集的平均KL-散度、余弦相似度、平均运行时间,并对比了扰动前后属性间的互信息以评估其关联性的变化。通过实验对比分析,表明本文的方法较好的保证了属性之间的关联性,并且可以带来较少的效用损失。图[9]表[6]参[52]
其他文献
随着智能终端业务的日益丰富和用户移动模式的多样化,传统的LTE网络已经无法满足用户对高带宽和高可靠性的通信需求。而小小区的引入很好地解决了这一问题。通过在网络中部署
茄子(Solanum melongena L.)是我国重要的蔬菜作物,种质资源丰富,果实色泽是其重要经济性状指标。花色苷是光依赖型紫茄果实的主要色素,其合成主要受外界环境和自身遗传机制
目的羟基多环芳烃(OH-PAHs),作为常用的多环芳烃暴露标志物,分析其在尿液中水平时,需要使用固相萃取技术除去杂质并富集目标物以达到仪器分析要求,但传统的固相萃取柱一次性使
无线移动通信行业的飞速发展,使得不可再生的频谱资源日趋紧张,为了改善这类状况,研究者们提出了认知无线电技术。该技术使得认知用户可以共享授权用户未使用的频谱资源进行通信,从而提高频谱利用率。目前认知无线电技术的研究主要从四个方向入手:即频谱感知、频谱分配、频谱共享和频谱切换。本文主要研究的是优化频谱分配方案和算法,对频谱资源进行更加合理有效的分配;同时当系统采用下垫式频谱共享方式时,为了降低对授权用
第一部分冠状动脉CTA观察HIV感染者冠状动脉斑块特征背景与目的随着高效抗反转录病毒治疗(Highly Active Antiretroviral Therapy,HAART)药物的使用,人类免疫缺陷病毒(Human
研究背景肥胖是一个巨大的公共健康问题,与2型糖尿病、动脉粥样硬化、高血压、癌症、哮喘、中风、非酒精性脂肪肝等代谢疾病密切相关。肥胖时出现脂肪组织的扩展,包括脂肪细
关键基础设施特指对社会与经济的良性运行至关重要的公共资产,譬如电力供应系统、通信系统、运输系统等。随着互联网技术的迅猛发展与广泛应用,基于IP协议的数据采集与控制技
目的对于缺牙区骨量不足的患者,理想种植体直径和长度的选择尚无统一标准,因此本论文旨在通过缺牙区骨量高度及宽度两个不同角度评估种植体长度及直径对临床预后的影响,以期
目的:探讨骨质疏松性椎体压缩性骨折椎体成形术后影响夹心椎体骨折的相关危险因素及为预防夹心椎体骨折提供临床理论依据。夹心椎是椎体成形术后一种较为特殊的邻椎,其定义是
目的:通过观察穿山龙薯蓣皂苷对痛性糖尿病周围神经病变小鼠坐骨神经PI3K/AK T/m TOR信号通路影响的研究,为穿山龙薯蓣皂苷治疗痛性糖尿病周围神经病变提供理论依据。材料与