论文部分内容阅读
在空间信息科学领域中,空间数据信息被喻为是地理信息系统(GIS)的“血液”,GIS承担着海量空间数据信息的组织与管理的重要任务。随着对地观测系统的发展与进步,人们可获得的地理空间数据呈现出爆炸式的增长。同样的,数据-信息-知识,这一必然的发展过程均给GIS的发展带来了巨大的挑战,并提出了更高的要求,同时也为GIS的理论与技术的发展向更高目标的迈进创造了机遇。WebGIS、分布式GIS等多种计算模式同GIS技术相结合的产物,初步实现了基于网络的空间信息服务,但这些技术并没有从根本上解决海量空间信息服务所面临的各种难题。近年来,网格计算逐渐成为人们研究的热点,其在空间信息科学领域中的应用正方兴未艾。网格概念的引入以及网格计算技术与GIS的融合,实质是又一次计算模式的革新,其目标是整合诸如计算资源、存储资源、设备资源等各种资源,实现海量空间信息的分布式处理与服务。然而,这一切都需要实现对海量空间信息的高性能存取与处理。因此,本文在此背景下对高性能并行GIS的矢量空间数据的存取与处理之关键技术进行深入地探讨与研究有其现实的意义和实用的价值。全文沿着传统GIS理论与技术的研发路线,从并行空间数据结构、并行空间索引机制、并行空间操作以及并行空间应用等多个层面深入分析和论述了高性能并行GIS和并行空间数据库中的基础理论和关键技术问题。在并行空间数据结构的设计方面,本文重点论述了矢量空间数据的建模方法,遵循OGC组织提出的简单要素模型规范,使用面向对象模型对其进行描述与表达。面向对象的矢量空间数据建模方法具有其固有的并行性特征,有利于实现并行空间数据库的并行I/O操作,提高并行空间数据的处理能力。本文采用对象关系型数据库作为基于无共享存储模式的并行空间数据库建库的基础数据库平台,矢量空间数据及其属性数据统一使用同一关系表进行存储和管理,这就意味着海量空间数据将对应着数量庞大的数据条目,所以,并行的空间数据划分策略是影响并行空间数据库性能的重要因素之一。文中提出了基于Hilbert空间填充曲线的并行空间数据划分(HCSDP)策略,与已有的数据划分策略不同的是,HCSDP充分考虑到空间数据本身的特征,如聚类特征等,使得划分后的空间子区域之间保持较为均衡的存储负载,这为实现并行空间数据库的静态负载平衡提供了保证。空间索引机制是GIS空间数据组织与管理的关键。对于并行GIS而言,并行空间索引机制对提高并行GIS和并行空间数据库的海量空间数据存储与管理能力更为重要。本文提出了基于Hilbert空间填充曲线的多层并行R树索引结构(HCMPR-tree),给出了该索引结构的设计与构造方法。与已有的并行空间索引结构相比,HCMPR-tree索引结构避免了使网络集群中主控制节点成为热点(hotspot)的可能性。HCMPR-tree索引机制以其优良的结构特性为本文后续的并行空间操作和并行空间应用中基础算法的设计与实现提供了更好的支持。空间操作是空间数据库的基本功能,本文给出了并行空间数据库中两种最为基础的空间操作的并行化设计与实现方法,即并行空间范围查询和并行空间连接操作。这两类空间操作的基础算法的并行化设计与实现均基于HCMPR-tree并行空间索引机制,算法的复杂程度与性能的优劣依赖于HCMPR-tree索引结构的特性。文中给出了并行空间操作中算法执行的代价模型,以便于对算法的执行效率进行定量地评估。本文在对高性能并行GIS的并行空间应用的研究中,首先结合三维地形可视化模拟应用实例,给出了在并行GIS和并行空间数据库支持下的并行空间应用的一般原理和过程。在这部分中针对空间网络分析中最优路径分析问题进行研究,给出了并行GIS和并行空间数据库支持下的并行最优路径分析算法的设计与实现,并针对其中的关键问题进行了深入的探讨。在并行最优路径分析算法的设计中,海量而复杂的空间网络数据的组织和图分区技术是关键。本文采用了基于HCMPR-tree索引结构的图分区策略,并给出了衡量图分区策略的评估标准与实现方法。在技术实现方面,本文给出了运行于PC网络集群并行计算环境下的基于经典的Dijkstra方法的并行最优路径分析算法的设计与实现方案,通过实验证明了本文所研究的在并行GIS和并行空间数据库支持下的并行空间应用是有效和可行的。全文采用的理论研究方法和关键技术的实现方案有利于形成一套较为完整的研究体系,以指导针对高性能并行GIS和并行空间数据库的研究与实践工作。