论文部分内容阅读
随着各种遥感仪器空间分辨率?频谱分辨率的不断提高,工作时间的延长,各种不同应用遥感影像的数据量急剧增长,积累了大量的影像数据?传统的GIS(Geographical Information System,地理信息系统)主要基于集中式的管理方式,单一节点的限制很容易成为海量影像数据管理的瓶颈,出现了影像数据积累多,可以利用的影像数据少?的难题,许多影像数据无法得到有效利用,不仅浪费获取的花费,而且占用大量的存储空间?因此,研究可以管理海量影像数据的信息系统是急需解决的技术难题?云?通常由成千上万的服务器集群组成,具有动态伸缩的特性,可以为人们提供无尽?的存储能力和计算能力?随着云计算的兴起和发展,为我们解决海量影像数据的存储和管理提供了新的思路和方法?Hadoop是由Apache基金会管理的一个开源项目?作为一个知名的开源云计算系统,它可以为人们提供一个分布式并行编程的框架,简化分布式程序的开发?论文基于Hadoop,对海量遥感影像数据影响金字塔的并行构建?海量遥感影像数据的存储两个方面对云计算应用于海量影像数据的管理技术进行了研究?论文的主要研究内容和创新点如下:首先,论文对传统的集中式的影像数据管理技术进行了分析,指出了传统影像数据管理系统在管理海量影像数据时存在的不足,同时介绍了基于Hadoop的开源云计算系统的特点及关键组成部分,提出来基于Hadoop的海量影像数据处理和存储的框架?其次,论文基于MapReduce并行编程模型的Hadoop云计算系统开源实现,研究了海量影像数据的影像金字塔并行构建技术?针对影像金字塔的特点,设计了一种基于Map和Reduce的并行和递归构建算法,使海量数据的处理分配到各子节点并行执行,大大加快了影像数据的处理速度?第三,论文基于Hadoop云计算系统的分布式列数据库HBase,对影像数据的分布式存储的索引机制进行了研究,提出了一种适用于海量影像数据分布式存储的索引——P2H,可以使得地理空间相邻的影像数据,物理上尽可能相邻或相近,提高海量数据的查询效率;同时对影像数据的模型进行了研究,提出来一种适合于多时相?多分辨率的海量影像数据的存储模型?可以对不同时段?不同空间分辨率的海量遥感影像进行存储和快速查询?最后,基于上述研究成果,设计了实验,验证了本文所提方法的有效性和实用性?