论文部分内容阅读
为了从海量数据集中准确查询出目标频繁项数据,需要应对大数据集的不确定性,现有方法随着数据量的增加,搜索得到的频繁项数据也随之增加,难以精确提取出有效的频繁项数据,导致在频繁项查询过程中的时间与空间效率低下。为此提出了基于极值扰动优化隐私框架的频繁项数据查询方法。采用隐私框架分层对不确定数据中隐藏的频繁项进行查询,在第一层中利用指数机制得到符合目标支持度的频繁数据粗糙集,在第二层利用拉普拉斯变化得到噪声期望,并对频繁项数据的极值扰动进行分析,得到其稳定状态下的概率,根据频繁项数据时变非线性设计相应的扰