粗糙集与聚类支持下的t-closeness隐私保护模型研究

来源 :山西师范大学 | 被引量 : 5次 | 上传用户:xiaolongyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,各个组织机构需要发布的数据越来越多,这些数据包含的隐私也越来越多,所以在发布数据之前需要对该数据进行一些处理,以免造成更多的隐私泄露。近些年,学者们对数据隐私保护模型的研究非常活跃,他们提出了一些模型,如K-匿名模型、L-多样性模型、t-closeness模型等数据保护模型,但是这些数据保护模型造成的数据损失比较大,本文主要对t-closeness模型进行了研究和改进。为此,本文做了以下工作:首先,综述了隐私保护、聚类算法、粗糙集等与论文研究内容相关的理论。其次,对t-closeness模型进行了改进,提出了基于聚类的改进的t-closeness模型,该模型主要针对t-closeness模型数据损失比较大这一缺点进行了改进。首先利用密度度量进行聚类减小了聚类过程中的信息损失,提高了数据的利用率,有效的保护了隐私。但是在实验的过程中发现使用该聚类方法对一些字符型数据聚类效果不是很明显,然后对密度度量又进行了改进,提出了基于粗糙集的K-最近邻算法。粗糙集在处理字符型数据方面有着独特的优势,利用粗糙集达到了较好的聚类效果。最后,以上模型都是针对单敏感属性进行保护,但是在实际应用中,敏感属性不可能仅仅是单一的,在待发布的数据中可能存在多敏感属性。所以本文最后提出了一种基于多敏感属性的t-closeness隐私保护模型。该模型把敏感属性分为两种:第一敏感属性和第二敏感属性。分别为这两种敏感属性设置不同的阈值t,使得各自满足不同阈值的t-closeness模型。
其他文献
企业业务管理过程都会涉及到工作流,建立业务过程的工作流模型,是完成工作流管理的重要步骤。在各种建模方法中,基于UML的工作流建模表现出诸多优势,为企业工作流系统的开发提供
21世纪是知识经济的时代,对知识的管理更是社会经济发展的主要驱动力和提高组织竞争力的重要手段。案例知识作为知识中的一个特殊类别,蕴含着丰富的信息和大量知识。案例知识
CPU是计算机系统的控制中心,也是系统中最复杂的部件。尽管CPU发展如此迅速,但是其基本工作原理并没有发生根本性的变化,而且在今后的一段时间内仍然会继续发挥作用。正因为
自动化信息管理技术和网络技术迅猛发展把我们带进了信息爆炸时代,海量的信息对用户产生了两方面的影响,有利的一面是用户多了更多的资源和供选择的信息,不利的一面是查找自己感
学位
虚拟机管理器Xen可以让一台物理机同时运行多个操作系统,提高了硬件利用效率,在企业服务器领域得到较好应用。然而,Xen在桌面计算机领域的应用模式还存在一些不足:特权域界面
路由问题,诸如旅行商问题和车辆路径问题,由于具有极高的学术价值和广泛的现实应用,因此得到了广泛的研究。同时,多目标优化由于提供了对问题新的定义的机会,因而得到了越来
软件危机和软件工业化进程促生了软件复用技术。基于构件的软件开发方法,可以提高软件生产率,是解决软件危机,推进软件工业化进程的有效途径。构件检索技术是基于构件的软件开发
PKI安全体系作为信息安全基础设施的一个重要组成部分,其核心是要解决信息网络空间中的信任问题,确定信息网络空间中各种行为主体身份的惟一性、真实性和合法性,保护各种主体
多源数据关联问题是无线传感器网络中多传感器数据融合的关键技术之一,也是其最核心的部分。联合概率数据关联算法是一种跟踪多目标的数据关联算法,它不需要任何关于目标和杂波