多维敏感属性相关联的隐私保护数据发布研究

来源 :广西师范大学 | 被引量 : 4次 | 上传用户:m634606037
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在开放的互联网时代,与个人信息相关的数据-微数据在网络上以指数级形式急剧增长,这些数据共享和发布可被用于进行海量数据分析,随着数据挖掘技术的日益发展及广泛应用,这些数据发布在科学研究、社会调查和舆情监控等方面,具有重大的利用价值。然而,微数据发布的同时也带来了隐私泄露的问题,在当今信息时代,个人隐私的概念发生了很大的变化,对隐私保护的需求也受到社会和公众的日益重视,在保证信息可用性的同时,如何保护用户的隐私成为了数据发布研究的主要问题。在现有的隐私保护数据发布研究中,大多数的研究主要针对单个敏感属性的数据集,而对于具有多维敏感属性的数据发布隐私保护的研究主要还是基于现有单个敏感属性数据发布方法的简单扩展,因而在实际应用中,会导致处理后数据的信息损失量过大,从而降低了数据的利用价值,尤其是现有的多维敏感属性数据发布模型对于敏感属性之间的多维关联性缺乏描述,攻击者可以利用这点进行攻击。针对多敏感属性的相关性导致的隐私泄露问题,本文围绕多维敏感关联性的隐私泄露原理、多维敏感关联的数据发布隐私模型以及隐私保护方法展开研究,在尽量降低信息损失量的同时,充分考虑到了攻击者利用敏感属性之间的关系进行攻击的情况,有针对性地提出了相应保护方案。本文的主要工作如下:①对现有的单维敏感属性数据发布模型K-匿名保护模型和L-多样性模型进行了深入的研究和分析,指出了这些技术在用于多维敏感属性数据发布的一些缺点以及可能存在的安全隐患。例如,把L-多样性模型直接应用于多维敏感属性,随着敏感属性数目的增多,等价组会变得越来越大,导致了越来越多的信息损失量,’从而提出本文的隐私保护处理的基本思想;②对多维敏感属性数据的隐私关联性分析,给出数据的多维敏感属性之间的关联度描述,提出了一种利用关联规则的隐私攻击模式,并提出一种新的具有多维隐私关联性的隐私保护模型;③根据隐私泄露模式,提出了两种新的面向多维敏感属性的数据发布方法,在这两种模型中增加了攻击者背景知识,为了能充分考虑到敏感属性之间的关联性,本文在多维敏感属性数据发布技术中引入关联规则,可以有效避免攻击者利用敏感属性之间的关联规则进行攻击,并且通过对敏感属性进行泛化的方式降低了发布数据表的信息损失量。这两种保护模型保护强度逐步增强,隐私保护的侧重点也各不相同,为不同情况下的隐私保护提供了更多的选择;④为这两个模型提出了各自的实现算法,并利用真实的美国人口普查数据集Adult对该模型进行验证。通过实验结果得出,本文提出的模型不但能解决现有模型无法避免攻击者利用关联规则进行攻击的问题,还能保持着较高的数据发布质量。
其他文献
现代数字信号处理器(DSP)一般采取超长指令字或是超标量来实现指令级并行。超长指令字(VLIW)数字信号处理器将并行任务的识别和调度交给了编译器,因此在利用VLIW DSP的时候需
在通信技术迅速发展的今天,手机已经成为人们工作和生活当中不可或缺的联系工具。手机给人们带来众多便利的同时,也常常被不法分子利用作为犯罪工具,司法机关急需采取有效的技术
生物医学文献数量的急剧增加,使得生物医学从业者在海量生物医学文献中快速地获取大量的感兴趣的信息变得困难。因此,快速有效地从海量无结构化的文本中抽取出便于管理、查询
MicroRNA (miRNA)是一种非编码的RNA序列,这些长度约为21个碱基的序列在动物、植物、病毒基因的后转录过程中发挥着巨大的作用。MiRNA可以靶向到它们对应的靶基因,抑制某些基
信息时代,高速发展的计算机技术使许多有价值的信息被保存起来,但是如何将这些隐含信息有效地挖掘出来加以利用是我们不断研究的方向。关联分类作为数据挖掘中一种分类精度高,适
随着我国经济的发展,城镇人口增多,步行交通量随之增大,但很多交叉口的信号配时控制并不完善,不能合理地同时满足机动车和行人的通行效率,导致交叉口交通秩序混乱、安全隐患增加,严
在经济全球化的浪潮推动下,企业之间的业务协作逐渐频繁和复杂。作为对企业运转和管理来说必不可少的支撑系统,各个企业的应用软件之间也必须能够互通互联,以支持企业之间的
随着高科技的引入和全球化的发展,我国高等教育实现了不断跳跃的大发展,已挤身于教育大国的我们正往教育强国的目标努力。但高等教育发展时间较短、准备不充分的特点使其落后
近年来,随着研究生教育规模的不断扩大,申请学位的人数和类型不断增加,每年毕业的研究生数量不断增长,学位管理面临的压力越来越大。面对众多的毕业生,如何高效合理地完成复
由于支持向量机在处理高维小样本数据时的识别精度显著优于传统机器学习方法,因此支持向量机的多分类编码方法与应用研究是近年来多分类研究的热点。但是由于采用SVM进行多分