基于信息负表示的数据发布方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：kocis2815

【摘要】

：

现有的关于数据发布的工作集中于如何在数据发布时隐藏个体信息,已提出的方法大部分都是“正发布”方法,即直接对原始数据进行处理后发布,但其实这些方法发布的依然是“正”

【作者】

：

杜学海

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2014年期

【关键词】

：

隐私保护数据发布 K-匿名 l-多样性信息负表示负调查

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现有的关于数据发布的工作集中于如何在数据发布时隐藏个体信息,已提出的方法大部分都是“正发布”方法,即直接对原始数据进行处理后发布,但其实这些方法发布的依然是“正”的数据。因此,这会使得攻击者有可能通过特定的攻击手段,如同质化攻击等,从发布表中获取到用户隐私,从而造成隐私泄露,给用户利益带来危害。由于负表示是将原始数据用其补集来表示,具有很强的隐私保护能力,因此本文将负表示思想引入到数据发布领域,提出了新的数据发布方法,即将每条记录的敏感属性值使用其负表示的值进行替换,发布带有“负”的敏感属性值的数据,从而提高现有方法的隐私保护度。本文的工作主要集中在以下几个方面：(1)由于传统数据发布的k-匿名模型发布的是带“正”的敏感信息的发布(未处理原始数据的敏感信息),且k-匿名模型发布数据时未考虑到各个等价类中“正”敏感信息的分布,这些缺陷使得k-匿名容易受到同质化攻击等方式的攻击,从而造成隐私泄露。因此,本文将负表示与k-匿名模型结合,提出了(k, m)-anonNPD算法。该算法对k-匿名的发布数据进行了负表示转换,从而最终的发布数据在非敏感属性上不可区分,同时对应的敏感属性值都是“负”的敏感属性值,以此达到隐私保护的目的。本文通过理论分析和相关的实验,将本文提出的(k, m)-anonNPD算法与k-匿名进行了比较,证明了(k, m)-anonNPD算法隐私保护能力比k-匿名更强,同时该算法也具有实用性。(2)l-多样性模型是基于k-匿名模型提出的,该模型对数据发布时等价类中的敏感信息的分布做了处理,使得发布数据的每个等价类中至少包含l种不同敏感信息,克服了k-匿名发布时会出现的同等价类中的敏感信息的分布可能会比较集中的缺陷,但是l-多样性发布的数据依然包含“正”的敏感属性值。本文将负表示与l-多样性模型结合,提出了(l, m)-divNPD算法。该算法在l-多样性进程中将原始数据进行了负表示转换,从而使得发布数据中的敏感信息都是“负”的敏感信息,且这些“负”的敏感信息具有更好的多样性,提高了隐私保护能力。本文通过理论分析和相关实验,将本文提出的(l, m)-divNPD算法与l-多样性进行了比较,证明了(l, m)-divNPD算法相比l-多样性模型具有更强的隐私保护能力,同时也具有实用性。(3)本文提出了两种算法(k, m)-anonNPD算法和(l, m)-divNPD算法,这两种算法都将对应的传统数据发布模型的发布效果做了一定的提升。但是,这两种算法具有各自的特点,因此,本文针对提出的(k, m)-anonNPD算法和(l, m)-divNPB算法,通过相关实验对这两种算法进行了比较,分析了两种方法的各自的特点。本文将负表示思想应用到数据发布领域,并将负表示与数据发布领域的经典模型k-匿名模型和l-多样性模型结合,分别提出了新的基于k-匿名模型的(k, m)-anonNPD算法和新的基于l-多样性模型的(l, m)-divNPD算法,并通过理论分析和相关实验,验证了两种算法的隐私保护能力和实用性。

其他文献

基于CPN的服务组合流程中隐私数据分析研究

随着因特网及数据挖掘技术的快速发展,因特网软件的使用者对个人隐私数据的安全给予了越来越多的关注。通过WEB服务或服务组合建立起来的软件不但要重视功能需求,还应该重视

学位

BPELCPNP3P隐私数据

一种基于有序偏好的P2P网络信任模型

自P2P网络问世以来,就受到了越来越多的关注,现已被使用在各种各样的网络应用中。P2P网络改变了传统网络中的客户端/服务器模式,采用端对端原则,网络中所有实体之间都是平等

学位

对等网络信任模型有序偏好期望向量层次分析法

面向园区网络的分层式流量区分系统的研究

随着互联网的普及，日益增长的网络流量和不断出现的各种网络新应用大大增加了网络的复杂性和管理难度，这严重威胁到网络服务质量和网络安全，对网络管理提出了巨大挑战。在这种情

学位

在线流量分类分层式流量区分系统机器学习可视化技术网络管理

基于多GPU的协同过滤推荐算法研究及应用

随着互联网信息的爆炸式增长,信息超载导致人们很难在短时间内从海量信息中获取自己感兴趣的信息,个性化推荐系统作为信息过滤的一利一重要手段应运而生。协同过滤推荐算法是

学位

个性化推荐协同过滤大数据多GPU

基于aCoral操作系统的设备驱动模型及USB协议栈的设计与实现

嵌入式系统具有悠久历史,从上世纪60年代发展至今已取得长足的进展。特别是随着近些年移动互联网和物联网的兴起,嵌入式系统更是发展的如火如荼。aCoral正是由电子科技大学嵌

学位

aCoral设备驱动模型usb ohci协议栈

多种特征模板的依存句法分析算法

依存句法分析是相对与传统短语结构句法分析更有优势的工具。它的优势主要在于简单性和普遍性：它可以让有很少语法背景知识的人快速地了解一个句子的结构并且对于各种语言都用

学位

依存句法分析半监督方法长距离依存关系

基于背景建模的TBB和CUDA并行策略研究

背景建模是运动目标检测方法中应用比较多的一种方法,是图像处理领域的一项关键技术并且有着广泛的用途。由于图像处理本身需要大规模的运算,所以利用并行计算对图像处理进行

学位

单高斯算法混合高斯算法TBBCUDA

可共享多通道Cache设计及存储体系的CPN建模与验证

片上多核处理器体系结构因其低设计复杂度、高性能、低功耗等特性成为当今主流的处理器架构。但片上高度集成给各内核的高速并发访问带来了巨大的压力,而多核处理器结构设计

学位

多核存储体系并行性AUMCC体系设计CPN建模模型验证

多核协同计算平台的研究与实现

现代处理器架构的关注重点已经从增加时钟速度转移到增加处理器核的数量,多核处理器已逐渐取代单核处理器,成为提高处理器性能的主要途径。从处理器核的结构来看,多核处理器

学位

嵌入式多核协同计算双操作系统

蛋白质磷酸化模式挖掘算法研究

磷酸化模式代表了位于磷酸化位点周围具有位置特殊性的氨基酸序列。鉴于磷酸化模式可以用于研究磷酸化相关的基本调解机制以及磷酸化位点预测等相关问题,因而有很重要的研究

学位

磷酸化模式频繁模式挖掘置换检验全局统计意义局部统计意义

基于信息负表示的数据发布方法研究

与本文相关的学术论文