论文部分内容阅读
随着计算机技术的发展,数据流已经成为数据存在的一种常见形式,被广泛应用到金融、交通、军事等领域。研究人员设计开发了许多集中式数据流管理系统以及分布式数据流管理系统以处理数据流上的查询。由于集中式数据流管理系统的处理能力有限,分布式数据流管理系统得到了快速发展,尤其是针对广域数据流的处理。而网内查询处理则是分布式数据流管理系统的研究核心。
本文主要研究网内查询处理中过滤算子的放置问题。网络中有很多数据流,包括过滤算子产生的数据流以及数据源产生的数据流。一个查询到来时,既可以使用数据源产生的数据流,也可以使用算子产生的数据流。显然,使用算子产生的数据流有可能降低查询结果到达目的节点的延迟。首先使用基于查询包含的数据流共享算法降低整个网络的延迟,然后对这种方法进行改进并提出了动态调整算法和基于查询合并的数据流共享算法。动态调整算法可以调整网络中查询的放置位置,基于查询合并的数据流共事算法可以将同一节点上的查询进行合并,减少数据流重叠部分的传输。但基于查询合并的数据流共享算法可能引入多余的元组,我们提出了基于查询分割的数据流共享算法来解决这个问题。但是,以上三种方法只优化了网络延迟。在更为通用的覆盖网络中,提出了一种基于模拟退火的算子放置算法来优化节点负载及网络延迟。最后,大量实验表明算法对于降低网络延迟非常有效。