保护隐私的K-匿名模型研究和改进

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xiebf1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的迅速发展,使得越来越多的信息被共享。自由访问型微数据发布是当前科学研究和信息交换的有效手段,也为数据共享提供了平台。但是,随着数据挖掘技术的应用及搜索引擎功能的不断强大,自由访问型微数据发布中的隐私泄露问题也日益突出,隐私保护成为数据库安全的一个新的热点研究方向。传统的方法在应对该类型隐私泄露问题时,不仅不能有效地保护隐私,还造成了发布数据严重失真,使得数据的发布失去意义。K-匿名是微数据发布中防止隐私泄露的有效方法,其思想简单,易于实现,是当前隐私保护的流行模型,但是K-匿名模型也有其本身的局限。论文通过对K-匿名模型的深入研究,指出了K-匿名模型的不足,并提出了一种新的改进模型,该模型能够有效应对K-匿名模型的缺陷。论文的主要工作包括:   ①基于前人对K-匿名的研究成果和解决方案,研究了K-匿名保护隐私的作用,重点分析了K-匿名在解决隐私保护属性泄露方面的缺陷,并通过进一步分析得出隐私保护的属性泄露过程中的属性保护度问题,指出不同的敏感属性在应对属性泄露时可以设置不同的保护强度,从而避免更多的信息损失。   ②通过对当前解决隐私保护的K-匿名模型的缺点的分析,提出了保护隐私的(alp,dif)-个性匿名模型,该模型不仅可以有效处理K-匿名不能应对的属性泄露问题,还考虑了敏感属性值的保护度问题,最大限度地保证了准标识属性的有效性。为保证发布数据的可靠性,该模型采用泛化的方法对发布数据进行预处理,提出了基于信息泛化损失的贪婪泛化算法,泛化属性的选择不仅考虑信息损失的大小,并综合了泛化属性对敏感属性的重要性,两者的积作为最终选择泛化属性的标准。   ③利用经典实验数据集对该模型进行验证,通过实验结果得出,保护隐私的(akp,dif)-个性匿名模型不仅能够解决K-匿名无法应对的发布数据属性泄露问题,同时在执行时间增加不多的条件下,保证了发布数据的有效性。
其他文献
模型拟合是计算机视觉中一个重要的研究领域,是鲁棒统计学、机器学习和图像处理等多个学科的交叉研究方向。模型拟合的主要任务是能够有效地拟合观测数据中所蕴含的所有模型实
语义问题一直是自然语言处理领域的一个难点。近年来,随着深度学习技术的逐渐兴起,越来越多的研究采用深度神经网络对语义相关的问题进行建模。在语义层面上开展研究,能更为有效
服务注册中心是SOA的重要组成部分,它负责服务的注册、发现和管理等功能,是维护SOA计算模式正常运行的基础。传统的服务注册中心采用集中式结构。随着服务数量不断增加,集中
随着计算机技术的发展及互联网的广泛应用,各行各业积累了大量的应用数据。如何对这样海量的数据进行高效而精准的学习成为亟待解决的难题,引起了学术界和工业界的广泛关注。面
随着多媒体技术的发展,多媒体数据已成为信息处理领域中主要的媒体形式。其中,音频信息在多媒体信息中占有非常重要的地位。音频数据是一种非语义符号表示和非结构化的二进制
随着网络技术的飞速发展和企业信息化的推进,将传统监控系统与Web技术相结合的模式成为远程监控系统研究和开发的热点,构建基于Web的监控系统成为监控领域发展的方向之一。远
自组织链表是针对搜索问题提出的,它能够在响应未知访问请求序列的过程中不断调整节点位置,使链表结构逐渐进入一个能充分利用访问请求序列特性的状态,从而降低总体访问代价,
无线传感器网络是在微电子、无线通信和嵌入式系统等技术的快速进步中发展起来的一种新型网络。它能够实时监测、感知、采集和处理各种监测对象的信息,具有十分广阔的应用前
煤岩突出是煤矿生产中的重大灾害之一,它是指煤、岩石以及瓦斯中的能量突然释放或爆发性的喷出,即煤、岩石以及瓦斯在极短的时间内向巷道或工作面大量涌出的过程,通常也称为
GBDT(Gradient Boosting Decision Tree)是一个应用广泛、效果好的监督式机器学习模型。它于2001年由Friedman提出,由决策树(Decision Tree)和梯度提升(Gradient Boosting)组