分布式序列模式挖掘中隐私保护技术研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:liuguoqiangswu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在序列模式挖掘过程中,隐私保护是一个必须要考虑的前提,尤其在分布式环境下更加值得关注。现有的分布式数据挖掘隐私保护问题研究主要集中在关联规则挖掘方面,而对于分布式序列模式挖掘中的隐私保护方法研究的却很少。因此,深入研究分布式序列模式挖掘的隐私保护方法将具有较高的学术价值和十分重要的现实意义。   论文介绍了分布式序列模式挖掘中隐私保护方法的国内外研究现状和基本知识,重点对分布式序列模式挖掘及其隐私保护方法进行研究。针对现有隐私数据保护方法可能会影响到序列模式挖掘结果的可用性和有效性,提出了一种面向隐私数据保护的分布式序列模式挖掘方法。针对分布式序列模式挖掘中敏感序列保护方法中存在的不足,利用关联规则挖掘中规则隐藏的思想,提出了一种分布式序列模式挖掘中敏感序列保护方法。并在序列模式挖掘中隐私数据和敏感序列保护算法的基础上,设计并实现了一种基于隐私保护的分布式序列模式挖掘原型系统。   论文的主要研究成果包括以下几个方面:   1、总结了分布式序列模式挖掘中隐私保护的研究现状,介绍了经典的序列模式挖掘算法,对序列模式挖掘中隐私数据和敏感序列隐藏算法进行研究。   2、针对现有分布式隐私数据保护方法可能会影响到序列模式挖掘结果的可用性和有效性等问题,提出了通过修改事务相应的项目来实现序列模式中隐私数据保护的方法IT-PPSPM,该方法既可以实现隐私数据的有效保护,又能确保序列模式挖掘结果的有效可行性。   3、分析研究了分布式序列模式挖掘算法的分合思想,结合关联规则挖掘中实现隐私保护的思想,研究并提出了一种分布式序列模式挖掘的隐私保护算法LDSA,该方法通过删除原始序列来降低敏感序列的支持数来达到隐藏的目的。   4、综合本文的研究成果,设计了基于隐私保护的分布式序列模式挖掘系统。该系统主要包括数据预处理、隐私数据处理、敏感序列处理和分布式序列模式挖掘四个功能模块。  
其他文献
数据通信的发展越来越趋向于无线化,但是无线网络中,有限的带宽资源以及复杂多变的信道特性,限制了视频和音频等多媒体实时业务服务质量。在2005年底出台的IEEE802.11e是传统
随着网络技术的迅速发展,互联网上的信息量呈几何级数的增长。对于不同背景和不同兴趣爱好的人,要从浩瀚的信息海洋中找到其需要的信息,是一项较大的挑战,个性化的信息检索系统满
随着互联网规模的急剧膨胀以及互联网新业务的大量涌现,使得网络拥塞不可避免。在网络研究领域,拥塞控制已经引起了越来越多研究人员的关注。路由器中采用主动队列管理(AQM,A
随着互联网技术迅猛发展,XML文档由于其自身的自描述性、半结构化、可扩展性等特点,已经成为当今网络时代的信息载体与交换方式,一个高效、快速的XML文档聚类机制将会极大缩
对等网络(P2P Network)技术发展十分迅速,各种基于对等网络技术的应用软件层出不穷,已经广泛应用到文件共享,分布式计算,边界服务等各个方面。据德国互联网调研机构ipoque称,
随着互联网和信息服务技术的高速发展,不同信息系统之间的互联互通,乃至整合集成已经成为一种迫切的需求,网格技术是解决这一需求非常有效的手段。网格技术提供了一个架构平
用户界面是软件系统的重要组成部分,占用了软件系统大量的开发时间。加之,信息技术的不断发展,以及计算机在人们的日常生活、工作与科研活动中的广泛应用,人们对用户界面的要求也
通过对Web日志进行挖掘,站点管理者可以发现用户的浏览模式,了解不同用户的兴趣和整个站点页面的访问情况,从而可以通过调整网站的逻辑组织结构来优化其拓扑结构。目前,一些
在高等院校理工科教学中,实验教学是整个教学过程中的重要环节,特别是基础课、专业基础课的实验教学在本科教学中尤为重要,它对学生的专业知识起着有效的支撑作用。   本论文
半监督学习是近几年来机器学习的一大研究热点,相比于传统的无监督和监督学习,半监督学习同时利用有标记和无标记样本来提高学习效果。其中,半监督聚类是半监督学习的一个重