局部差分隐私约束的扰动数据发布

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:zlp_dream
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,便捷的网上购物和个性化的新闻推荐逐渐成为人们日常生活中不可或缺的一部分。在享受这些服务的同时,大量用户的信息数据被不断收集、使用和发布。一方面企业和机构通过这些数据可以更加全面的了解用户,另一方面这些发布的数据可能会泄漏用户的隐私信息,因此在数据发布前需要对其进行匿名化处理,避免用户的敏感信息被泄露。后随机响应是隐私保护数据发布的有效方法之一,这方面的研究工作主要考虑如何设计扰动矩阵,且假设数据集属性变量之间的关系是独立或者完全相关。由于假设数据集属性完全独立会导致它们之间的关系由于扰动而破坏,从而使数据效用下降;假设属性完全相关会导致数据列联表稀疏,计算复杂度过大。为解决该问题,本文提出局部差分隐私约束的扰动数据发布算法,主要研究敏感属性与部分准标识符属性存在依赖关系时,如何有效减小重构攻击导致的隐私泄漏风险。首先,本文按照准标识符属性与敏感属性之间的依赖度对准标识符属性进行划分,用互信息理论寻找原始数据集中对敏感属性具有强依赖关系的准标识符属性,为精确扰动数据属性提供理论依据;其次,针对关联属性和非关联属性,应用不变后随机响应方法分别对某个数据属性或者属性之间的组合进行扰动,使之满足局部ε-差分隐私,并从理论上分析了后随机扰动对隐私泄露概率和数据效用的影响;最后,使用UCI机器学习库中公开的Adult数据集进行了广泛的实验,通过KL-散度、决策树分类准确度等数据分布方法,有效验证了本文所提算法的有效性和处理增量数据的能力。通过理论分析和实验验证,该算法相比较传统随机扰动算法,具有更高的隐私保护水平以及更好的数据效用。图[14]表[7]参参考文献[48]
其他文献
茄子(Solanum melongena L.)是我国重要的蔬菜作物,种质资源丰富,果实色泽是其重要经济性状指标。花色苷是光依赖型紫茄果实的主要色素,其合成主要受外界环境和自身遗传机制
目的羟基多环芳烃(OH-PAHs),作为常用的多环芳烃暴露标志物,分析其在尿液中水平时,需要使用固相萃取技术除去杂质并富集目标物以达到仪器分析要求,但传统的固相萃取柱一次性使
无线移动通信行业的飞速发展,使得不可再生的频谱资源日趋紧张,为了改善这类状况,研究者们提出了认知无线电技术。该技术使得认知用户可以共享授权用户未使用的频谱资源进行通信,从而提高频谱利用率。目前认知无线电技术的研究主要从四个方向入手:即频谱感知、频谱分配、频谱共享和频谱切换。本文主要研究的是优化频谱分配方案和算法,对频谱资源进行更加合理有效的分配;同时当系统采用下垫式频谱共享方式时,为了降低对授权用
第一部分冠状动脉CTA观察HIV感染者冠状动脉斑块特征背景与目的随着高效抗反转录病毒治疗(Highly Active Antiretroviral Therapy,HAART)药物的使用,人类免疫缺陷病毒(Human
研究背景肥胖是一个巨大的公共健康问题,与2型糖尿病、动脉粥样硬化、高血压、癌症、哮喘、中风、非酒精性脂肪肝等代谢疾病密切相关。肥胖时出现脂肪组织的扩展,包括脂肪细
关键基础设施特指对社会与经济的良性运行至关重要的公共资产,譬如电力供应系统、通信系统、运输系统等。随着互联网技术的迅猛发展与广泛应用,基于IP协议的数据采集与控制技
目的对于缺牙区骨量不足的患者,理想种植体直径和长度的选择尚无统一标准,因此本论文旨在通过缺牙区骨量高度及宽度两个不同角度评估种植体长度及直径对临床预后的影响,以期
目的:探讨骨质疏松性椎体压缩性骨折椎体成形术后影响夹心椎体骨折的相关危险因素及为预防夹心椎体骨折提供临床理论依据。夹心椎是椎体成形术后一种较为特殊的邻椎,其定义是
目的:通过观察穿山龙薯蓣皂苷对痛性糖尿病周围神经病变小鼠坐骨神经PI3K/AK T/m TOR信号通路影响的研究,为穿山龙薯蓣皂苷治疗痛性糖尿病周围神经病变提供理论依据。材料与
局部差分隐私是隐私保护数据发布领域中最强大的隐私保证模型之一。然而,该模型目前主要用于单属性数据采集,关于多属性关联的数据发布研究很少。此外,当数据属性值在数据发布中独立扰动时,可能会导致过多的信息损失。因此,基于局部差分隐私的关联数据发布保护研究已成为一个需要解决的迫切问题。首先,针对隐私保护数据发布中属性间关联性被忽略的问题,本文提出构造κ-度私有贝叶斯网络的算法。该算法将互信息与贪婪算法相结