抵制近似攻击的微数据发布隐私保护匿名模型及算法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:yncai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息领域存在大量与个体相关的数据,这些数据被称为微数据。比如:医疗患者数据、人口普查数据、企业经营数据等。微数据对疾病研究、趋势分析、市场分析等都具有重要作用,因此,很多机构都在收集和发布微数据。然而,微数据通常含有个体的隐私信息,它的共享与发布会对个体隐私造成威胁。在发布微数据时,如何有效地保护个体的隐私已成为信息安全领域和数据库领域的研究热点。至今,该领域相继出现了很多研究成果,但是这些成果很少考虑到不同敏感值之间的语义相似度,不能抵制近似攻击。因而,为了更好地保护微数据中的个体的隐私信息,开展抵制近似攻击的微数据隐私保护模型及算法的研究具有重要意义。本文从匿名化模型及其对应的算法两个方面,对微数据发布中的相近性攻击进行了研究并提出了相应的匿名模型和算法,主要工作有:(1)提出抵制分类型敏感属性近似攻击的(k,ε)-匿名模型。现有的匿名化方法,在匿名化分类型敏感属性微数据上存在不足,不能很好地抵制近似攻击。针对该问题,提出了可以抵制近似攻击的(k,ε-匿名模型,可分为强(k,ε)-匿名模型和弱(k,ε)-匿名模型,该模型要求匿名数据中的每个等价类都是k-匿名的,对等价类中敏感值约束s-相似程度不同。为实现(k,ε)-匿名模型,提出了(k,s)-KACA算法。实验结果表明,强(k,ε)-匿名模型和弱(k,ε)-匿名模型增强了敏感值的约束,提高了匿名数据抵制近似攻击的能力,能够更好地保护个人隐私信息。(2)提出抵制近似攻击的隐私保护(l,e)-diversity模型。现有的l-diversity模型没有考虑到不同敏感值之间存在语义相似度,不能很好地抵制近似攻击。为此,提出了可抵制近似攻击的隐私保护匿名模型一(l,e)-diversity模型,该模型要求匿名数据中的每个等价类中至少有l个良性表示,且任2个敏感属性值不是e-相似的。最后,基于分解技术,提出了最大桶分组算法,实验结果表明,(l, e)-diversity的匿名模型比l-diversity匿名模型具有更高的多样度,能够更好地抵制近似攻击。(3)提出了面向多敏感属性近似攻击的(l, e,m)-diversity匿名模型。现有的数据隐私发布方法多是面向单维敏感属性的。然而,在现实生活中,发布的数据往往包含多个敏感属性。通常情况下,多维敏感属性的数据发布也存在近似攻击的问题。针对该问题,在前一个工作的基础上,提出了(l,e,m)-多样性模型,其中m为敏感属性的个数,该模型要求匿名数据的每个等价类中,每一维上都满足(l, e)-diversity匿名约束。同时也提出了实现(l,e,m)-多样性模型的算法--MSBF算法。实验结果表明,(l, e, m)-diversity匿名后的数据比MBF, MSCF和MMDCF三种算法都具有较高的保护隐私的能力,解决了多维敏感数据隐私保护问题。
其他文献
随着因特网的迅速发展,网络中的信息资源快速增长。搜索引擎己成为人们获取信息的必要途径和重要手段。国内外许多研究机构已经对搜索引擎技术开展了大量的研究工作。目前,搜索
工作流管理技术满足了集中管理业务过程的需要,因此自从20世纪70年代产生以来工作流管理技术得到了广泛的应用,并促进了业务过程的发展。通过采用工作流管理技术构建的工作流系统因为提供了业务操作的平台而被称为业务操作系统。工作流管理技术涉及的领域众多。仅就工作流建模领域而言,目前存在多种建模方法。但这些建模方法存在着一些不足,比如模型语义与模型在计算机内部表示形式语义之间存在较大的差距、模型不能描述具有
随着Web技术的广泛应用,许多企业都迫切要求构建自己的Web业务系统。虽然这些业务系统因具体业务不同而有所不同,但从软件开发的角度看,这些系统的开发过程大致是相同的。针对相
信息量的剧增和网络异构性推动着基于agent的分布式网络管理迅速发展。基于agent的分布式网络管理中需要解决的核心问题是:分布式网络管理中多agent任务分解与调度问题。任务
进化计算是当前人工智能、知识工程、数据挖掘中的研究热点。遗传算法和遗传编程,是众多进化计算模型中的两个最典型的模型。F.Candida于2001年草创了新的进化计算模型基因表
随着全球计算机领域软硬件技术的不断发展,测试测量设备日益趋于微型化。嵌入式操作系统以及基于嵌入式操作系统的软件开发也日益受到人们的重视。Windows CE操作系统是目前
随着社会的数字信息技术和网络技术的高速发展,计算机不再局限于以前的PC,各种形态不同、性能千差万别的嵌入式系统得到了广泛的应用。由于现在嵌入式系统硬件水平的快速提高,以
随着计算机硬件技术的高速发展,处理器和网络性能迅速提高,价格日益下降,并行计算逐渐从传统的超级计算平台转移到集群平台上。Beowulf集群系统由于良好的性价比,己成为广大科研
采购管理是企业管理的重要组成部分,管理的优劣直接关系到企业的运作效率和竞争力。 不同的原材料在企业生产中占有不同的地位,直接影响到企业的库存状态和采购计划的制定,所
项目调度问题(Project Scheduling Problem,PSP)是指对一个工程项目中的多项任务进行调度,在满足项目本身的各项约束条件的前提下确定其中各项任务的开始执行时间,尽可能达到项