论文部分内容阅读
数据挖掘是指从大型数据库或数据仓库中提取人们感兴趣的知识。随着数据库技术和网络技术的发展,人们日益关心数据挖掘过程中隐私数据的安全性问题。隐私保护的关联规则挖掘成为数据挖掘领域的一个新兴的研究方向。本文提出的P_ODMA算法以DMA算法为基础,对其在存储空间、挖掘效率、安全性方面作了相关的改进。首先,本文使用二进制压缩编码技术对数据库中的所有事务集进行编码,降低了事务的存储空间,提高了挖掘算法的处理速度。在数据挖据的效率方面,本文采用剪裁事务数据库的方法削减事务集中非频繁的项目集,缩短了每个事务的长度。通过合并重复的事务减少了事务集的扫描次数和存储空间,达到了提高数据挖掘效率、降低空间复杂度的目的。在对数据的隐私保护方面,本文采用RSA加密与同态加密相结合的加密方案,该方案综合考虑了数据加密的安全性和加密算法的高效性,达到了效率与安全的平衡。其次,本文在关联规则的筛选方法进行相关的改进,提出了基于“提升度”关联规则选取方法。最后,本文针对P_ODMA算法的特点,采用一种改进的全局主站技术作为算法的实现架构。