论文部分内容阅读
本文从GIS空间分析和云计算环境下的GIS空间分析的研究背景出发,针对当前GIS数据量大的现状,根据GIS空间分析的原理与方法,结合云计算的Hadoop开源框架,以空间连接操作、缓冲区分析和叠加分析为研究对象,设计了相应的空间分析操作函数,运用MapReduce分布式编程技术,在相应的空间分析操作函数的基础上对这几种空间分析进行并行化设计,并搭建了平台进行实验与分析,主要做了以下工作:(1)分析了当前国内外的GIS空间分析以及GIS空间分析在云计算环境下的研究现状,阐述了空间分析对于GIS的重要性、当前GIS数据量增大对于空间分析的影响以及云计算环境下的Hadoop框架与GIS空间分析相结合的优势。(2)阐述了Hadoop开源框架对GIS空间数据格式的要求,根据GIS空间数据格式设计了相应的空间数据格式转换函数,实现了空间几何数据格式与Geojson文本数据格式之间的相互转换,分别用于处理输入与输出数据的格式。(3)为了更有效的进行云计算下的GIS空间分析,针对空间数据和GIS空间分析的特点进行了空间数据的划分以及云计算环境下的GIS空间分析任务调度,实现了基于空间填充曲线的数据划分以及GIS空间分析任务调度的策略,解决了任务调度的负载均衡问题。(4)与一般的并行GIS空间分析不同的是,本文搭建了云GIS空间分析框架,并针对具体的空间分析设计了相应的空间分析操作流程。(5)针对具体的空间分析设计了相应的空间操作函数,并结合具体的空间操作函数设计了相应的并行空间分析算法,实现了云计算环境下的空间分析。(6)搭建了Hadoop云计算平台和配置了Hive数据仓库运行环境,使用了不同数据量的空间数据在单机以及Hadoop集群环境下分别进行了实验,对各种空间分析的实验结果进行了分析和评价,验证了并行算法的优越性,并且通过不同集群规模进行实验,验证了集群性能良好的可扩展性。本文是在传统的GIS空间分析原理与云计算技术的基础上,提出了基于Hadoop的GIS空间分析平台设计理念,并设计了并行空间分析算法,提高GIS空间分析的性能。