论文部分内容阅读
描述了隐私保护数据挖掘技术研究进展。针对隐私保护关联规则挖掘算法EMASK计算效率较低,同时不适用于动态变化数据库等的问题,提出基于粒度计算的增量式隐私保护数据挖掘算法BIEMASK。该算法用粒度计算的思想对EMASK算法进行改进,利用增量式更新算法FUP解决增量式事务数据库频繁项集计算问题。在实现隐私保护的同时,减少了I/O操作的次数,降低空间开销,由此提高计算效率。结果证明,无论是固定增量集数据库还是可变增量集数据库处理中,BIEMASK相对于EMASK而言,效率时间都有较大幅度的提高。