基于遗传算法的关联规则隐私保护挖掘研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:kf_haiyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘产生巨大财富的同时,随之产生的就是隐私泄露的问题,如果数据使用者无法保护相关数据和知识,所采集到的数据往往和真实的数据间存在很大的差别甚至不能够完成数据采集,在这些数据上实施相应的数据挖掘工作而获得的结果必定是不精确的乃至根本是错误的。数据挖掘就会遭遇“巧妇难为无米之炊”的窘迫局面,连最好的数据挖掘方法也于事无补,隐私保护水平的高低和能否取得较为真实的数据之间有着直接的关系,进而影响到挖掘结果的实用性和可靠性。因此,如何能够在数据挖掘的过程中处理好隐私保护已经成为一个数据挖掘研究领域中亟待解决的关键性问题。   论文在介绍了关联规则挖掘问题的研究现状、相关技术的基础上,重点探讨了基于遗传算法的关联规则挖掘、隐私保护关联规则挖掘、分布式隐私保护关联规则挖掘等问题,并就其中的一些关键问题进行了较为深入的探讨,提出了相应的解决方案。   论文的主要研究工作包括以下几个方面:   (1)介绍了关联规则挖掘、遗传算法以及隐私保护等方面的发展现状和相关技术。   (2)针对遗传算法应用于关联规则挖掘中所面临的问题,对选择、交叉和变异等算子加以改进,提出一种基于自适应遗传算法的关联规则挖掘方法ARMMBAGA。   (3)提出了一种基于遗传算法的隐私关联规则保护算法PARPABGA,通过设置其适应度函数,将遗传算法应用于隐私保护关联规则挖掘中,有效的隐藏了敏感关联规则,提高了算法的效率。   (4)提出了一种基于向量点积的分布式隐私保护关联规则挖掘方法T-VDC,并在此基础上提出一种基于遗传算法的分布式隐私关联规则保护方法DPARPMBGA,在有效保护各个站点隐私数据的同时达到高效地挖掘出分布式数据库中的关联规则。
其他文献
随着互联网技术的迅猛发展和普及,特别是Web2.0的兴起,网上购物、微博、博客及BBS论坛等各种新兴的互联网应用正成为人们感兴趣的热点,而网上购物后的评论、博客、微博以及BBS上
汽车电子化大大推动了汽车技术的发展。为了紧跟汽车电子化进程,本文参与开发了一款拥有自主知识产权的16位车用微控制器ESNL-16。ESNL-16微控制器兼容飞思卡尔MC9S12系列微控
从上世纪五十年代末开始月球一直是世界各国开展深空探测的热点,中国航天科技集团公司(CASC)于2004年正式开展月球探测工程,并命名为"嫦娥工程"。航天设备具有工程复杂、费用
随着市场经济的快速发展,我国制笔工业有了迅速的发展和进步。许多制笔企业为提高生产效率和增强企业竞争力,引入机械手设备,并将其应用到制笔生产中,实现生产过程中模具的自动脱
随着生活水平的逐渐提高,旅游已成为绝大多数人的休闲活动之一,且在当今信息技术快速普及的趋势下,用户在制定旅游计划时,一般会优先通过检索平台去查询相关的旅游信息。但互
动漫产业是一个新兴的产业,它被视为是创意产业的一种,并被越来越多的国家和城市所重视和大力扶持,尤其是群体动画。例如现在比较受人们关注的《变形金刚》、《熊猫功夫》等大型
轨道交通站点的行人流特性与站点建设和运营组织密切相关,随着站点内行人的增加和集中,提高行人在轨道交通站点内的移动效率,减小行人在进站、出站和换乘过程中的延误,改善行
软件度量是软件设计与开发的科学保证之一。其中,软件复杂性度量是软件度量的一个重要方面,它与软件的可靠性、可维护性有着密切的关系。近年来,软件行业发展迅猛,所开发的软
雾天环境下,由于大气的散射作用,导致户外监控系统捕获的图像对比度低,景物不清晰的现象,给人类的生产生活带来了一定的影响,因此对雾天条件下降质图像清晰化方法的研究具有
论文围绕非参数正交多项式密度估计理论,以图像数据为研究对象,在总结国内外关于图像数据密度估计和分割、融合研究的基础上,提出基于图像数据的非参数正交多项式密度模型及正交