层次数据发布中的分级隐私保护方法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:weiyuanbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的快速发展,各式各样的网络应用和终端层出不穷,当人们在使用这些应用和终端时会产生大量包含用户信息的数据。这些用户信息包括性别、年龄等普通信息,也包括疾病诊断记录、位置记录、特殊商品购买记录等敏感信息。对于某些机构或者企业而言有着巨大的研究意义和商业价值,例如医院可以通过对病人的疾病诊断数据进行相应的病理研究分析发现某些疾病之间存在并发症的关联性,从而可以辅助医师更加有效地进行疾病的诊断和治疗;而某些电商企业可以通过用户的购买记录数据进行分析挖掘不同用户的购买兴趣从而实现对用户感兴趣商品的精准推送。因此数据的重要性在信息时代的今天尤为突出,研究人员也在不断的开发新的数据库来更加精准和全面的完成对用户信息的记录。特别是近些年来不同类型的非关系型数据库(例如MongoDB)不断被开发出来,在这样的数据库中往往采用具有层次结构性的标记语言(例如XML、JSON,YAML等)来对数据进行描述,因而此类数据也被称为层次数据。它们能够清晰地表示数据中存在的结构信息,因此相比于关系型数据而言具有更高的研究价值。当数据在被相关机构收集后出于研究的目的需要共享给第三方之前必须要对其进行适当的隐私保护处理,否则会造成严重的隐私泄露问题。因此数据发布中的隐私保护技术一直是信息安全领域研究的热点问题,但是目前该方向的研究主要是针对传统的关系型数据,针对层次数据的研究非常少。由于层次数据的重要性,急切需要研究相应的隐私保护模型和匿名算法来解决层次数据发布中的隐私保护问题。本文针对目前层次数据l-多样性匿名方法中存在的问题展开研究,通过对造成目前层次数据匿名方法中所存在问题的原因进行了详细的分析,提出层次数据的分级隐私保护模型和相应的匿名算法,用以解决目前层次数据隐私保护方法中所存在的同质攻击问题。本文的主要研究工作如下:(1)对传统的关系型数据和层次数据隐私保护方法的研究现状分别进行了综述和分析,指出了传统的关系型数据的隐私保护模型和方法并不能直接应用于层次数据隐私保护的场景,并且对现有的层次数据隐私保护方法中存在的同质攻击问题进行详细的阐述和分析。(2)提出了针对层次数据的分级隐私保护模型:(?_i~h,k)-匿名模型,用来解决目前层次数据隐私保护方法中面临的由同质攻击所导致的隐私泄露问题。该模型首先利用模糊集理论的思想对层次数据的敏感属性值进行敏感程度的划分,然后根据参数?_i~h对等价类中数据记录进行筛选,使得等价类中不同级别敏感属性值个数不超过给定的阈值k*?_i~h,从而增加了等价类中敏感属性值之间的差异程度,有效的阻止了由同质攻击所导致的隐私泄露问题。(3)基于所提出的层次数据分级隐私保护模型,设计了相应的实现算法。并对算法的组成模块和各模块的实现细节进行了详细的描述。然后对所提出的模型安全性以及算法复杂性进行了分析,最后介绍了层次数据发布场景的特点并设计了层次数据分级隐私保护数据发布的系统框架以及实现我们提出的匿名算法的软件体系结构。(4)通过测量匿名处理后数据集的信息损失量、等价类相异度和执行时间分别在数据的效用性、安全性以及算法执行效率上对我们所提出的和现有的层次数据匿名方法进行评估。实验结果表明我们的方法在数据效用性和安全性方面要远优于现有的层次数据匿名方法,而且在算法的执行效率方面与现有的层次数据匿名方法非常接近。
其他文献
随着云计算技术的兴起,云平台上的计算资源和存储资源应用的越来越普及,基于这种新型系统架构,云计算提高了应用系统的可扩展性和高可用性;其业务模型能够满足企业降低成本、
在传统的数据分类中,通常需要挖掘区分能力较高的频繁序列作为分类依据,从而为用户提供潜在的高价值信息。近年来,随着不确定数据处理需求的快速增长,挖掘不确定数据集上的区
清末新式学生群体是由传统走向现代的第一批学生群体,也是五四新学生乃至当代学生的雏形。近代对中国影响较深的人才,究其源头,大都是由清末新式学生成长起来的。本文以湖南新式学生为切入点,从近代区域学生史、教育史的角度,对清末湖南新式学生群体的产生背景、发展概况、与社会变革的关系,进行了较为全面的论述。清末湖南新式学生群体是在民族危机加深、民族资本主义初步发展、新式教育改革的背景下诞生的,他们主要是一批接
随着互联网技术的逐渐普及,人们的社交方式也从传统模式逐步发展到线上平台交流,夜以继日的新用户增加使得各类线上社交平台产生出越来越多的社会网络数据。社会网络数据除了
随着众包模式作为一种新型的经济模式,国内外不同类型的众包平台也如同雨后春笋般的涌现。基于NoSQL数据库的轻量级众包平台是目前使用的最为广泛的众包模式,其高效的读写性
铁基非晶合金具有优异的软磁性能,在共模电感、变压器、互感器等领域已经取得广泛应用,在特高压、核工业等极端服役环境下也有广阔的应用前景。开展强电场和辐照等强外场环境下非晶合金组织演变和性能变化,对非晶合金的成分开发和应用具有重要的意义。然而,目前关于强外场作用对非晶合金影响的研究较少。基于此,本文以铁基非晶薄带材料为研究对象,采用强电场处理和辐照处理,研究分析外场处理前后的组织性能,阐明外场作用下物
Why-not问题,致力于对查询结果中的缺失数据作出解释,近年来在数据库社区受到很大的关注。对why-not问题的合理解释,能够提高数据库的可用性,在实际生活中有很多重要应用。移
在现实生活中存在着各式各样的社会网络,如路由自治网络,科学家合作网,Twitter用户关系网等。对于社会网络的研究早在1969年之前就已经开始,研究发现社会网络具有小世界性质,
自香农的第一篇巨作问世以来,信息论已经吸引了大量研究者的注意并且对其它领域产生了重要影响,例如计算机科学、密码学以及通信领域等等。在信息论的众多研究方向中,信源编
随着消费类电子产品的不断发展和日益普及,越来越多的产品中具备了图像存储和展示功能。与此同时,如何对数量庞大、种类繁多的图片进行有效管理成为了一个重要的研究课题。对