论文部分内容阅读
提出了基于聚类的敏感属性l-多样性匿名化算法,该算法生成的每个聚类至少有l个不同的敏感属性值,每个聚类的大小介于l和2l-1之间,以达到最优划分并提高教据的安全性.同时,该算法生成聚类候选记录集以减少不必要的计算和比较,生成聚类时总是选择与聚类质心信息损失最小的记录,提高了算法效率并减少信息的损失.实验结果表明,该算法是高效的,且生成的匿名数据集具有较高的可用性.