论文部分内容阅读
在序列模式挖掘过程中,隐私保护是一个必须要考虑的前提,尤其在分布式环境下更加值得关注。现有的分布式数据挖掘隐私保护问题研究主要集中在关联规则挖掘方面,而对于分布式序列模式挖掘中的隐私保护方法研究的却很少。因此,深入研究分布式序列模式挖掘的隐私保护方法将具有较高的学术价值和十分重要的现实意义。
论文介绍了分布式序列模式挖掘中隐私保护方法的国内外研究现状和基本知识,重点对分布式序列模式挖掘及其隐私保护方法进行研究。针对现有隐私数据保护方法可能会影响到序列模式挖掘结果的可用性和有效性,提出了一种面向隐私数据保护的分布式序列模式挖掘方法。针对分布式序列模式挖掘中敏感序列保护方法中存在的不足,利用关联规则挖掘中规则隐藏的思想,提出了一种分布式序列模式挖掘中敏感序列保护方法。并在序列模式挖掘中隐私数据和敏感序列保护算法的基础上,设计并实现了一种基于隐私保护的分布式序列模式挖掘原型系统。
论文的主要研究成果包括以下几个方面:
1、总结了分布式序列模式挖掘中隐私保护的研究现状,介绍了经典的序列模式挖掘算法,对序列模式挖掘中隐私数据和敏感序列隐藏算法进行研究。
2、针对现有分布式隐私数据保护方法可能会影响到序列模式挖掘结果的可用性和有效性等问题,提出了通过修改事务相应的项目来实现序列模式中隐私数据保护的方法IT-PPSPM,该方法既可以实现隐私数据的有效保护,又能确保序列模式挖掘结果的有效可行性。
3、分析研究了分布式序列模式挖掘算法的分合思想,结合关联规则挖掘中实现隐私保护的思想,研究并提出了一种分布式序列模式挖掘的隐私保护算法LDSA,该方法通过删除原始序列来降低敏感序列的支持数来达到隐藏的目的。
4、综合本文的研究成果,设计了基于隐私保护的分布式序列模式挖掘系统。该系统主要包括数据预处理、隐私数据处理、敏感序列处理和分布式序列模式挖掘四个功能模块。