论文部分内容阅读
随着信息和通信技术的快速发展,计算模式经历了从最初把任务集中交付给大型处理机模式,到后来发展为基于网络的分布式任务处理模式,再到当今按需处理的云计算模式。云计算作为一种革命性的计算模型在很多行业都成为重要的技术趋势。将云计算应用于空间地理信息领域所形成的空间云计算也逐渐成为空间地理信息行业的主流技术。近年来,随着基于位置的服务(LBS),地理空间数据量正在迅猛的增长,给传统的空间数据索引机制带来了很大的冲击,而这些传统的索引方法往往是基于内存的或者需要优化的磁盘访问为先决条件。因此,如何实现高效的空间索引和査询处理大规模空间数据成为云计算环境应用的新需求和挑战。一种可扩展的、分布式的空间数据查询技术不失为进行高效空间数据查询和分析的最佳选择。本文设计了一种基于云环境的面向位置服务的反向网格索引以及基于反向网格索引的并行KNN(k-Nearest Neighbor algorithm)查询算法。本文的主要工作有:第一、对云计算的相关概念进行了介绍,如MapReduce并行计算模型,Hadoop软件系统,以及分布式数据存储文件系统等。然后介绍了Hadoop平台下MapReduce任务执行过程。第二、简要介绍了当前存在的几种空间数据索引算法,如R-树的索引、反向网格的索引和Voronoi多边形的索引,着重分析了每种方法的特点以及存在的问题,在此基础上,分析了KNN空间查询算法及其运用在面向位置服务查询领域的优势。第三、通过对反向索引的定义、组成和建立分析,结合反向网格索引的优势,对KNN算法进行了改进,提出了基于MapReduce的反向网格索引构建算法,并将其运用在面向位置服务查询中。第四、基于Hadoop搭建实验平台,通过实验对基于MapReduce的R-树索引(MRTree)、基于反向网格索引(MRGrid)、Voronoi多边形索引(MRVD)方法,分别从索引的建立速率和服务查询速率两方面来分析MapReduce下的面向位置服务查询的改进效果。