分布式环境下关联规则挖掘的隐私保护方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:lcc00060
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络、通信和计算机技术的迅速发展,数据挖掘呈现出数据海量化,分布式挖掘等特点,如何在挖掘过程中保护隐私数据和防止敏感信息泄露已成为当前面临的重大挑战,隐私保护数据挖掘(PPDM)也已经成为数据挖掘(DM)领域的一个重要课题。关联规则挖掘是应用最为广泛的数据挖掘方法之一。本文对分布式环境下关联规则挖掘的隐私保护方法进行研究,目的就是在最大化地挖掘出数据库中潜藏的知识的同时保护数据隐私。本文从敏感数据的保护和敏感知识的保护两个方面,介绍了数据挖掘中常用的隐私保护技术;在概述了数据挖掘技术的基础上,重点介绍了分布式关联规则挖掘的原理和流行的算法,分析了各种算法的优缺点。在此基础上,本文针对分布式关联规则挖掘中敏感知识的保护进一步做了以下研究工作:(1)对于水平划分的数据集,设计了一种在本站点隐藏敏感规则的数据清洗算法。该算法在对本站点的数据集做最小改动的基础上,实现了对本站点数据集中敏感规则的完全隐藏,较大程度地保证了全局挖掘结果的准确性和对敏感规则的隐藏效果。此外,还采用RSA加密与同态加密相结合的加密方案对各个站点之间传送的频繁项集信息进行加密,该方案综合考虑了数据加密的安全性和加密算法的高效性,达到了效率与安全的平衡。(2)对于垂直划分的数据集,分布式关联规则挖掘的隐私保护的关键在于安全地计算全局频繁项集。本文提出一种新的安全求项集支持度的协议,该协议可以在准确地求出项集的支持度的同时不泄露各个站点的私有信息。(3)对文中设计的相关算法做了实验,实验结果表明这些算法具有较好的隐私保护性、准确性和高效性。论文在分布式环境下关联规则挖掘的隐私保护方面做了有益的工作。
其他文献
随着无线网络和移动通信在全球的迅速发展和普及,无线数据广播技术越来越成为一个重要的研究热点。数据广播是无线环境中的一种非常高效的发布信息方式。服务器将热点数据通过
随着恐怖活动的加剧,各式汽车炸弹袭击事件频发,社会公共安全和恐怖主义威胁成为世界上很多国家共同关注的焦点。在我国有些犯罪分子利用车辆底盘藏匿违禁品或爆炸物的情况时常
近几年来,大规模的文本分类问题是一个十分热门的话题,特别是在针对网络数据的网页分类问题以及层次分类问题。并且,在基于维基百科等大量网络数据的处理中,大规模的样本类数
当前高档汽车广泛使用嵌入式处理器、现场总线和控制软件等电子技术实现和控制汽车部分功能,形成复杂的分布式控制系统,并且安装了越来越多的智能传感器,其所需处理的信息大
随着 Web技术的发展,Web服务在互联网中的数量迅速增长,互联网上出现了大量在功能上相同或相近的 Web服务,但是它们的非功能属性往往是不同的,因此在对这些服务进行操作时,不仅需
随着科技的发展和各应用领域需求的日益增长,计算机视觉研究一直以来都被国内外研究者密切关注,动态前景分离作为计算机视觉的低层处理部分,其分离结果一方面直接决定着动态
随着网络技术的快速发展,网络业务不仅包括传统的数据业务,还包括语音、视频等多媒体业务。多媒体业务要求网络提供很高的带宽,低时延和低抖动等。为满足新型网络业务的服务
无线多媒体传感器网络是在传统的传感器网络的基础上发展而来的,引入了多媒体信息的感知内容(如视频、音频等),具有更强的感知能力。但是,传感器节点资源(能量、带宽等)有限,而多
随着Internet的迅速发展,大数据时代已悄无声息地到来,数据的规模较之过去已呈现出井喷式的增长态势,同时数据结构亦愈发复杂多变。在这样的情势下,由于传统的数据分析方法在
由于互联网技术的不断进步与各类电子终端的迅速普及,我们获取资讯的方式发生了重大的改变,网络信息已经成为社会中各种信息的重要载体。其中,新闻视频以其丰富、直观表达方式成