数据挖掘中基于关联规则隐私保护算法的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:guidahuasheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘的任务,就是从海量数据中,发现其中有用的信息。利用有价值信息可以指导人们的生产与生活,以此产生较大经济价值。随着科技的发展,人们也越来越重视从数据库中发现和挖掘信息与知识。在利用数据挖掘技术和工具给人们提供知识和信息的同时,人们也逐渐的发现了随之带来严重的弊端,挖掘过程中极有可能暴露重要的私有信息。在这样的情况下,如何保护私有数据或敏感信息在数据挖掘过程中不被泄露,同时又能够得到较为准确的挖掘结果,已经成为数据挖掘领域中一个很有意义的研究课题。  目前,关于数据挖掘中隐私数据保护的算法大多应用于决策树挖掘,关联规则挖掘,聚类挖掘等方面。本文着重地对基于关联规则的隐私保护算法进行分析,主要关注随机响应技术与关联规则的结合,讨论了变换参数与挖掘算法准确性之间的关系。  本文在隐私保护的关联规则挖掘领域做了以下三个方面的研究:  一是在随机响应技术方面,基于随机数的特性,经分析和比较两种产生随机数的方法,比较得出混沌映射法相对于线性同余法在均匀性方面相对较优。将混沌映射法产生的随机数引入伪装原始数据集,便于提高隐私保护的性能。  二是对关联规则挖掘算法进行详细分析和分类,深入分析Apriori算法的特性,并证明了Apriori算法的各种属性和定理,充分依据相应属性,改进了Apriori算法,减少扫描数据库的次数和产生候选项的项数,节约了算法运行时间,比原有算法提高了的效率。  三是基于随机响应技术与关联规则的结合,讨论了随机响应技术中影响隐藏性的变换概率?与挖掘算法准确性之间的关系式,从理论上分析了这一关系式的合理性。同时还从理论上分析?与事物数据集规模大小的关系。经实验结果与理论分析结论基本一致。
其他文献
我国社会经济的高速发展离不开日益发达的道路交通运输,发达、快速的道路交通运输已经成为经济发展的必备条件。同时,随着人们的购买能力的增强,私家车的数量大幅上升,密集的道路
随着多媒体技术和网络技术的不断发展,多媒体信息的数量迅猛增长,为了充分利用已有的多媒体资源,研究多媒体检索技术变得越来越重要。音乐检索技术研究的是如何从大量音频信
AVS是我国自主创新战略的一个典型。从2002年开始,以AVS标准工作组的方式,组织了国内外两百多家单位、一千多人的队伍开展联合创新,制定了配套的数字音视频信源编码标准,成为
随着互联网的飞速发展,人们利用互联网共享各种信息,使得网络信息资源日趋丰富,搜索引擎正是为了解决这一问题而发展起来的,而现在的搜索引擎存在明显的缺陷:一是搜索引擎结
随着互联网的快速发展与Web 2.0时代的到来,在线新闻作为主要的网络信息载体,已经成为人们获取新闻资讯的主要渠道。其内容与形式也不断创新,允许用户通过情绪投票直接抒发自
调度的根源在于对资源的争用和分配,无线领域的分组调度主要是要保证用户业务的服务质量和各个业务流之间享受服务的公平性。高速上行分组接入(HSUPA)是第三代通讯伙伴计划(3
短信息以其移动性好,收发便捷,内容丰富等特点,受到广大移动通信用户的普遍青睐,特别是青少年手机用户,往往把收发短信作为信息交互,感情沟通和互动娱乐的主要方式之一。然而
With the development in DNA microarray technology, expression values of thousands of genes can be simultaneously measured efficiently in biological process. Co-
移动终端上发行数字内容,涉及到数字内容版权保护和解决终端查询数据速度等问题。本文提出了一个基于智能存储卡平台在移动终端开发数字内容发行软件的设计方案。利用智能存
经济的发展,工业化水平的提高,人口的快速增长导致了大气污染问题的日益严重。2015年柴静的雾霾调查“穹顶之下”更是引发了全民的关注。为了合理整治大气污染问题,准确反映空气