基于分类数据的隐私保护研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:zengyuzhuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐私保护数据挖掘近年来已成为数据挖掘领域一个活跃的研究方向,其研究主要有两方面的目标:一方面是为防止隐私信息的泄露提供有利的技术保障,消除信息拥有者在信息共享时的顾虑,促进信息交流和共享;另一方面是减少实施隐私保护过程所带来的信息损失,保证信息在数据挖掘领域的可用性,即在隐私保护和数据可用性之间达到一个较好的平衡。 本文的研究集中于在隐私保护过程中减少信息损失,以保证隐私保护处理后的数据在分类领域的可用性方面。本文首先总结了数据挖掘领域中已有的隐私保护方法以及在分类领域的研究情况,然后重点讨论了一种新的隐私保护方法l-多样化模型。针对利用l-多样化模型对数据进行隐私保护可能导致数据在分类方面可用性下降的问题,本文提出了一种适合分类数据的l-多样化模型实现算法L-BottomUp,L-BottomUp算法采取自底向上概化的方式搜索满足要求的l-多样化数据表,同时在概化的过程中保护对分类有利的信息。实验显示,相比已有的l-多样化模型实现算法L-Incognito,通过L-BottomUp算法得到的l-多样化数据表用于分类时具有更好的分类精度,因此L-BottomUp算法在使数据达到隐私保护要求的同时,也较好的保证了其用于分类时的有效性。
其他文献
XML自从1998年由W3C提出以来,就迅速的成为Internet上用于数据表示和数据交换的标准。XML文档大量涌现,XML的有效管理受到广泛关注。由于XML数据具有不同于传统数据形式的树
随着面向对象软件开发技术的广泛应用,面向对象的测试技术成为研究的热点问题。由于模型在软件设计和开发中得到普遍应用,基于模型的软件测试越来越受到人们的关注。基于模型的
随着现代软件工程的发展,基于软件构件复用的系统开发方法成为当前研究热点之一,而构件库管理系统作为对该软件开发过程提供支持的重要设施也被广大研究人员所关注。随着领域开
游戏引擎是一个处理游戏底层技术的平台,使用游戏引擎,游戏开发人员可以不用花过多精力去处理系统架构、图形处理等一些底层的技术,可以直接使用引擎提供的API来进行游戏开发。2
网格计算作为下一代Internet的一种计算模式,其核心任务是管理分布在Internet广域环境中的各种类型的软硬件资源,为基于Internet的分布式应用提供一个统一的、虚拟的共享资源
计算机流程管理技术已广泛应用于多个领域,随着Internet技术的发展及面向服务思想的兴起,流程的使用人群更加广泛,其个性化服务需求迅猛增长,传统的流程模式遇到了新的挑战。
近年来,随着Internet的大规模普及和企业信息化程度的不断提高,各种文本资源以惊人的速度增长,导致信息搜寻困难和信息利用率低下。快速高质量的文本聚类技术可以将大量文本信息
随着多媒体和Interact的迅速发展,对数字产品的保护和信息安全的迫切需要使得数字水印技术成为多媒体信息安全研究领域的一个热点问题。基于小波的多媒体水印算法近年来受到人
三维点云数据在影视游戏、逆向工程及文物保护与展示等各个行业的应用越来越广泛。囿于外界不可控变量、设备物理误差等因素,由测量设备得到的原始点云数据不可避免的带有许
在永恒发展的现实世界中,时间是信息的一个重要属性,大量数据都要在一定的时间背景下解释才有意义。随着计算机应用技术的深入和发展,人们对时态信息处理的需求也越来越迫切,时态