论文部分内容阅读
数据流聚集查询有着应用广泛,在计算和存储资源不足条件下,必须考虑构建有效概要数据结构,获取近似聚集查询结果。针对不符合典型分布的电力通信光纤监测数据流,提出一种基于聚类的直方图构建方法,获取流数据分布的不规则子区间集合;当新到达流数据,实时更新直方图;通过控制桶内元组计数密度误差,动态维护直方图桶结构,以适应窗口内数据实际分布特征。给出基于聚类直方图的数据流滑动窗口聚集查询算法。分析了算法精度、桶数目和允许误差的关系。实验结果表明,该算法对数据流滑动窗口聚集查询是自适应和有效的。