论文部分内容阅读
GML是基于XML对空间数据进行的编码,并为GIS领域和各企业广泛接受,是目前网络空间信息的重要组成部分。随着信息技术的发展,空间信息量急剧的增加;如何对GML空间数据进行有效的存储和管理成了影响GML发展的关键问题。依据GML空间数据自身的特性(地域分布性),使用集中式的存储不利于对空间数据的统一管理和访问;而云存储是一种商业化实现的分布式存储;它是将一些廉价计算机的空闲资源集中起来,共同分担海量数据的分布式存储和管理任务的。所以,对GML空间数据采用分布式存储和管理是一个比较好的方案。针对海量GML空间数据如何进行有效的存储,主要进行了以下几方面的研究及创新点分析:首先,需要对空间数据进行合理的划分,既要考虑空间数据多维的特性,又要考虑其空间关系和拓扑关系等;对几种空间数据划分进行分析过后,又对Hilbert曲线层次分解算法和GML矢量图层分割的空间数据划分进行了研究,提出了对GML空间要素图层的划分并结合Hilbert曲线层次划分快速编码的方法对空间要素对象进行划分处理;在具体的应用中,参照分布式存储系统中各子节点的信息对要素对象进行分块划分,并分配相应子节点的空闲资源进行分布式存储;其次,在云计算环境下对分布式数据库的设计,结合GML空间数据的特征和Hadoop平台的主从式架构,对各主从服务器节点所存储的相关表结构、数据类型等进行了设计。针对分布式存储的GML空间数据的索引机制和索引结构表也进行了分析研究,主要研究了QR树的特性和对GML索引的构建;最后,在Hadoop开源平台的主从式架构下对分布式存储的原型系统进行了设计和部分实现,并通过实验对单机存储和分布式存储的效率及其查询访问的效率进行了比较分析,得出了对海量的GML空间数据无论是在存储还是查询访问,分布式计算机集群的处理效率都高于单机的处理效率。创新点主要有通过Hilbert曲线对GML空间数据采用要素队列的划分方法;结合hadoop平台对GML数据的并行空间索引机制的创建及各子节点索引结构表的设计;GML空间数据分布式存储流程的设计;云存储系统功能设计与实现等。