论文部分内容阅读
随着地理实体时空数据规模的不断扩大,对时空数据管理系统的性能、可扩展性与可靠性提出了更高的要求。由于传统的时空数据管理系统以数据文件为主要存储方式,导致了在多台服务器中进行时空数据并行处理时效率低下和通用性差。基于MapReduce模式的时空数据组织方法将对海量数据的大规模操作分布给网络中的每个节点来实现其数据处理,为云环境下的时空数据的并行处理提供了技术支持。本文从地理实体特征构成的分析着手,结合MapReduce并行运算原理对地理实体时空数据进行对象化封装,以地理实体的最小逻辑单元(元对象)为地理实体时空数据的存储对象,利用基于MapReduce模式的Hadoop框架所具有的分布式存储机制,实现在计算机集群系统中时空数据的分布式存储,重点研究了基于Hadoop框架的时空数据存储模型的构建和并行查询方法。具体研究了以下几方面内容: (1)探索了地理实体时空数据组织方法和基于MapReduce模式GIS时空数据的组织,通过采用面向对象技术将地理实体抽象为时空对象,以元对象作为时空数据在Hadoop框架中的最小存储单元,研究了面向对象的地理实体时空数据组织方法。 (2)在对基于MapReduce模式的Hadoop存储框架的架构特点与工作原理进行分析和研究的基础上,利用Hadoop框架中的主服务器MasterServer来建立元对象与其组成的时空对象之间的映射关系,并以Hadoop框架区域服务器RegionServer作为时空数据的实际存储载体,根据MapReduce模式的并行运算模式,提出了一种时空数据查询并行化框架。 (3)通过对地理实体数据结构的分析,结合基于MapReduce模式的Hadoop框架中的分布式存储系统,研究一种基于Hadoop的时空数据模型,并将这一模型应用到城市道路信息的存储与查询中,结合城市道路自身的特点设计了城市道路信息的并行存储管理和并行查询方法。 本文以MapReduce模式为基础,根据MapReduce模式与时空数据查询过程的相似性,构建时空数据查询的并行化框架,并运用该框架对时空数据查询方法进行并行化改进,为计算机集群中海量时空数据的组织和查询方法研究提供新的思路。