论文部分内容阅读
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果。目前,隐私保护数据挖掘方法主要分为数据干扰和查询限制这两种策略。然而,它们本身却都存在着一些固有的缺陷,对隐私数据的保护程度不高。关联规则挖掘作为数据挖掘中的重要方法之一,在现有的隐私保护研究方面同样存在这样的问题。
为了提高隐私数据的保护程度和挖掘结果的准确性,本文将数据干扰和查询限制策略有机地结合起来,提出了一种新的数据随机处理方法——部分隐藏的转移概率矩阵(PHTPM)数据变换方法。本文首先利用PHTPM对原始事务集进行变换和隐藏;然后以此为基础,针对经过PHTPM方法处理后的数据,给出了一种频繁项集生成算法OPAM;最后运用有效的优化策略对OPAM进行改进,进而提出了一种简单而又高效的算法AOPAM。理论分析和实验结果均表明,基于PHTPM的隐私保护关联规则挖掘方法比原有的方法在数据的保护程度上具有更好的隐私性,在挖掘的结果上具有高的准确性;而且PHTPM方法也有着很好的高效性和适用性。