多敏感属性微数据隐私保护匿名模型及算法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:wcz741335565
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络时代涌现了大量与个体相关数据,即微数据,微数据对趋势分析,疾病预测以及经营决策具有重要的意义,因此很多组织开始收集和发布一些微数据,如医院会发布患者的医疗数据用于帮助医疗事业的研究与发展。然后,微数据的发布会对隐含在微数据中的个体隐私构成威胁。因此,近年来数据发布隐私保护的研究成为数据挖掘领域的研究热点。至今,该领域已出现了很多研究成果,然而这些成果多是面向单敏感属性的,而现实生活中存在大量多敏感属性微数据,单敏感属性的匿名模型及算法无法直接应用于多敏感属性微数据,因而,开展对多敏感属性微数据隐私保护模型及算法的研究具有重要意义。在多敏感属性微数据隐私保护的研究中,需要建立适合多敏感属性数据的匿名模型保证数据发布的安全性,同时还需要研究实现匿名模型的相应算法。本文从匿名化模型及相应的算法两方面,对多敏感属性微数据发布中的隐私保护问题进行了研究,具体工作有:(1)提出抵制多敏感属性关联攻击的(l,m)-多样性模型。现有的微数据发布隐私保护匿名模型均没有考虑敏感属性间的关联关系,不能抵制基于敏感属性间关系的攻击。为此,论文提出抵制敏感属性关联攻击的(l,m)-多样性模型,该模型要求匿名数据的每个等价类中,每维敏感属性上多样性至少为l,并且当某一敏感值从等价类中删除后,该等价类剩下的敏感值仍满足(l-1,m)-多样性。本文也提出了实现(l,m)-多样性的两个算法——BottomUp算法和TopDown算法。实验表明,所提出的算法能很好的实现面向多敏感属性的(l,m)-多样性模型,有效保护多敏感属性微数据的个体隐私。(2)提出SLOMS框架:一种面向多敏感属性的数据发布隐私保护方法。多维桶技术是匿名化多敏感属性数据较好的方法,然而在敏感属性数据较多时该方法会造成较大隐匿率。另外,该方法不泛化准标识属性容易受到连接攻击。为此,本文提出一种SLOMS方法,该方法将多敏感属性划分成多个表,分别对每个敏感属性表进行l-多样性分组,并且对准标识属性进行k-匿名泛化。本文也提出了一种基于SLOMS方法的MSB-KACA算法实现对微数据匿名化。实验表明,SLOMS方法产生的匿名数据表较泛化和多维桶技术具有较小隐匿率和较少信息损失。(3)提出面向多敏感属性隐私保护的分桶排列技术。分解技术是实现数据匿名的较好技术,然而分解未对准标识符处理,存在安全隐患。对此,本文提出分桶排列技术,该技术在分解的基础上,增加对准标识符的排列处理,同时结合多维桶分组技术应用于多敏感属性隐私保护中。本文也提出实现分桶排列技术的两种算法——NMBPA和CDMBPA。实验表明:两种算法均能较好的实现对多敏感属性数据的匿名化,产生的隐匿数据具有较好的数据可用性和较低的隐匿率,有效对多敏感属性隐私进行保护。
其他文献
伴随着网络信息技术的飞速发展,互联网+模式的迅速兴起,人们对于网络信息的获取与需求呈指数般增长。除了对文字信息的需求外,对于图像内容信息的认知与理解也逐渐为人们所重
现实中的很多问题可以转化为数据挖掘中的数据分类问题,这使得数据分类技术的应用领域十分广泛,例如商业保险、网络测量、气象预报、生物信息等。然而,随着信息技术的不断发展,各
移动机器人对工作环境地图信息的获取与更新是移动机器人在环境中正常工作的重要前提。距离网格地图作为描述环境信息的一种地图表示方式,是概率网格地图的重要补充,能够提供比
面向服务的架构(Service-Oriented Architecture,简称为SOA)是一个新兴的软件工程范例,用来开发动态演进的Web应用。服务的提供者和服务的使用者可以通过公共的服务注册机构
现实生活中存在着很多不平衡类数据分类问题,同时计算机和互联网技术的快速发展,使得现实生活领域的数据膨胀速度异常迅猛,因而大数据时代的不平衡学习面临着更为严峻的挑战,如何
数码照片和视频数据的急剧增长需要既能支持速度快又能支持内容形象化浏览的表达技术。随着图像文件数量的爆炸式增长,管理大量图像的内容的能力已成为一项关键技术。  一
目前国内外各个城市都在积极构建智慧城市应急指挥平台,但盲目无序的重复建设无法保证平台功能的完备性、通用性和可扩展性,本文将通过对于大量平台应用实例的分析,从领域工程的
随着网络和存储技术的不断发展,越来越多的数据呈现出数据量大、维数高等新的特点。这些海量的高维数据包含更加丰富信息的同时,也带来了如维数灾难、计算量大等问题,对数据
当前全球化竞争不断加剧,企业要寻求新的发展,必须专注于自己的核心业务,将自己擅长的方面发挥到极致;同时,企业对于自己不擅长的业务可能需要借助于其他企业的制造服务和能力
钻孔柱状图、勘探线剖面图等是地质工作者经常使用的基础性、先导性图件。它们是由各种花纹图案、曲线、文字等基本符号构成的,不仅能够清晰的表达地层岩性、地层特征,而且能够