一种基于聚类的语义l-多样性隐私保护算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:fangfei123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络和存储设备的逐渐普及,推动了智能交通、基于位置服务推荐等应用的发展,然而,他们所发布的数据中往往包含隐私信息,如果不经过任何处理直接将这些数据进行共享会导致个体敏感信息的披露。这就引发了对数据发布过程中的隐私保护课题的探索和研究,其主要目标是平衡好数据的安全性和数据的可用性,一方面要损失一些信息以保护个体的隐私,另一方面要保留数据原有的重要信息以便对其进行分析。本文在分析研究l-多样性模型的基础上,针对传统的l-多样性模型虽然保证了每个分组中敏感属性值的多样性,但是没有考虑到敏感属性的语义信息这一问题,提出一种使用聚类技术来实现的语义l-多样性算法:首先将敏感属性的语义信息加入到l-多样性模型中,使得生成的每个等价类分组中语义不相似的敏感属性值的个数大于或者等于l个。其次在划分等价类的过程中采用聚类技术,在满足语义l-多样性的前提下,把数据集中最相似的记录放在一个簇中,并在算法的最后对所生成的类簇进行调整,将导致匿名表信息损失变大的类簇拆开,并将类簇中的记录插入到与其距离最近的类簇中,进一步减小概化操作所造成的信息损失,提高匿名数据表的质量。最后概化簇中记录的准标识符属性,实现数据表的匿名化。最后通过实验进行验证。实验结果表明本文中提出的算法能够有效地防止相似性攻击并且信息损失小,尽可能多地保留数据的可用性。
其他文献
随着通信技术、计算机技术和网络技术的发展,会议系统越来越多的应用在人们的社会生产和生活中。目前跨地域的企业内部会议,企业间的商务会议等正越来越多地使用会议系统。各个
随着计算机硬件性能的飞速提高,网络中存在着大量闲置的计算资源,如何有效的使用网络中大量闲置的高性能的硬件资源;以及如何设计网络模型,以使网络提供高质量、高保障、高效
随着数字信息技术的飞速发展,由传统的模拟电视到数字电视的数字化革命已成为必然。数字电视将带给我们全新的视觉冲击和前所未有的大容量信息资源。我国目前也正在经历着电视
传统的软件开发模式,从需求->设计->开发->测试需要层层环节,每个环节都要靠相关的文档等传递各自的成果。但是随着现代社会的高速发展,对软件开发的要求也越来越高,在当今无论是商
在工程应用领域存在着许多计算量庞大的问题,如力学计算等。这些计算问题的程序有许多是用Fortran语言编写的,并且在串行计算模式下单机运行,其正确性已得到时间的验证,但其计算
由于科学技术的持续发展,信息可视化越来越流行,它与人们的日常生活越来越紧密相关。信息可视化是一种研究大规模非数值型信息资源的视觉呈现的技术,旨在帮助人们理解和分析
自动信任协商是解决开放式网络环境中陌生实体之间建立信任关系的一种方法。在协商中,协商节点既要隐藏自身敏感信息,又要相互暴露信息来增强彼此信任,这种矛盾的局面使得协
随着移动互联网以及移动计算技术的飞速进步,移动对象数据管理与分析的需求不断扩大,推动了移动对象数据库相关研究的发展。此外,如舰船仿真等的军事仿真实验系统中也面临着
近年来,图像处理技术在很多行业都得到了卓有成效的应用,一定程度上为这些行业提供了一种新的方法,新的工具。笔者拟将图像处理技术应用到图书馆藏书清点工作中,做出一些初步的探
电子商务、电子政务等基于Internet的网络增值应用发展迅速,这些应用对信息安全的需求也随之提升。公钥基础设施是目前公认的解决大型开放网络环境下信息安全问题最可行、最有