论文部分内容阅读
自上个世纪70年代以来,各种对地观测技术的陆续开展已经累积了长期的历史遥感信息,随着近年来高时空谱对地观测技术的快速进展,以及相关遥感卫星的接连发射,遥感数据量得到爆发式增长,已经成为GlS(Geographic Information System)的主要信息源,无论是遥感信息本身还是其处理分析都呈现出“大数据”特点:Volume(体量大)、Variety(维度多)、Velocity(速度快)。另一方面,SOLAP(Spatial OLAP)基于空间数据仓库,以时空数据立方体模型为载体,将商业智能中的OLAP(Online Analytical Processing)技术成功扩展至GIS数据,为多维度、多主题、多重粒度、多级层次的时空数据交互式发掘提供了一种快捷通道。如何将呈现“大数据”特点的遥感信息融入到SOLAP立方体模型中,是当前利用SOLAP进行遥感信息多维分析所亟待解决的问题。本文针对当前SOLAP研究现状及存在问题,以高性能遥感信息SOLAP立方体为研究目标,展开了以下理论与方法研究:(1)以SOLAP概念、方法与体系结构为基础,提出了基于地理格网的分布式遥感信息SOLAP立方体模型(TileCube)。首先,从逻辑层引入基于多级地理格网的空间度量,并对传统SOLAP立方体进行扩展,实现了模型数据的分布式组织与构建,并通过对空间维度与非空间维度的构建、以及度量与数据方体的定义,有效地表征了遥感信息的多维特性。同时引入多维地图代数,灵活地描述了维层次间以及方体间聚集运算的多维特性。最后,基于逻辑模型中Key-Value数据方体的松散耦合设计,从物理层上研究TileCube在云存储环境BigTable中的可扩展存储机制与查询方法,并实现了TileCube方体从物理层到逻辑层的无缝映射。(2)针对SOLAP集成遥感信息后面临的海量数据多维分析性能问题,通过引入Map-Reduce计算模式研究TileCube方体构建及分析所涉及的高性能聚集计算方法。首先,为加速遥感数据方体的ETL引擎,探讨了实时数据处理环境下的Tile立方体格网化方法及其优化机制;然后提出基于Map-Reduce的并行多维地图代数方法,将大规模遥感聚集计算解构为基于Tile的并行地图代数任务,实现Roll-Up、Drill-Across等SOLAP在线分析操作;最后结合SOLAP引擎的工作及优化机制阐述,为SOLAP在线分析提供了有力的驱动管理支撑。(3)为验证本文所提的TileCube模型理论及其高性能聚集计算方法的可行性与高效性,以SOLAP的视角建立了旱情监测与分析原型系统,将长时序MODIS(Moderate Resolution Imaging Spectroradiometer)卫星遥感数据、地面实测数据以及其他基础空间数据统一纳入到TileCube中。原型实现了遥感旱情监测相关信息的时空快速聚集,并通过多种旱情时空在线查询实例充分展示了TileCube的交互式信息多维分析能力。本文研究成果体现三方面的创新性:(1)提出了集成遥感信息的分布式SOLAP立方体模型,解决了海量遥感信息的多维特征表达与扩展问题。(2)发展基于Map-Reduce计算模式的并行多维地图代数,实现SOLAP立方体模型中的大规模遥感信息快速时空聚集与在线分析。(3)提出针对实时遥感数据流的立方体格网化优化方法,加速SOLAP立方体的ETL过程。全文沿着“基础理论——立方体模型——计算与分析——应用实证”的主线,对遥感信息SOLAP相关理论、方法及实现进行了一体化探讨与研究,解决了现有SOLAP对遥感数据的“多维”特征支持不足和“大数据”分析能力有限的问题。有助于推动遥感信息多维分析方法的创新与拓展,有助于SOLAP在GIS领域的进一步研究与发展。同时,作为一种新型的空间信息分析工具与架构,该成果将为高性能空间信息基础设施建设提供有力的方法与技术支撑。