论文部分内容阅读
处理分布式环境下高速数据的最大挑战在于如何利用少量网络资源输出高质量的查询结果.对面向分布式环境的最近邻查询问题进行了研究,提出了一种基于过滤器的新方法,不仅能计算精确查询结果,还能够处理五类近似查询.该方法在各个远程站点均安装了智能过滤器,并通过合理设置过滤器的范围来降低数据传输量.理论分析及基于模拟数据集合和真实数据集合的实验报告均表明新方法具有较高的性能.