论文部分内容阅读
数据挖掘一直是数据库研究、开发和应用中最活跃的分支之一。无论在研究领域还是商业应用,数据挖掘都取得了可喜的成果。而关联规则挖掘在数据挖掘技术中占有很重要的地位,其在商务决策的制定方面很有应用前景。
目前很多大企业都有分支机构,各个分支机构又都自成一体。一方面,这些分支机构希望广泛地收集信息,并从中挖拥出有用的知识和模式米指导其更好地发展。另一方面,因为关联规则挖掘揭示的是不容易发现的模式或各种知识,如果不正确使用。就可能会对隐私和信息安全构成威胁。因此关联规则挖掘要面临的两个重要问题就是在分布环境下的挖掘和挖掘过程中的隐私保护。针对前一个问题,现今已开发出一些分布式挖掘算法;而后一问题目前还没有得到很好的解决,成为今后的研究热点问题。
本文分析了现有分布式关联规则挖掘算法的优缺点,对现有算法在效率和安全性两方面进行了改进,引用密码学中的不经意传输协议,设计了一套安全高效的分布式关联规则挖掘算法OT-PPDM,以保证此过程中安全地交换统计信息而不涉及具体隐私细节,从而更好地满足现代企业和商务发展的隐私性需求。
文章最后,设计仿真实验将OT-PPDM算法与另外两种代表性的分布式关联规则挖掘算法(FDN快速算法和C-PPDM加密算法)进行了比较。实验结果表明本文算法有较好的安全性,高效性和适用性。