论文部分内容阅读
随着空间对地观测和IT技术的不断发展,从各种卫星、传感器等获取的空间数据与日俱增,呈爆炸式增长,空间信息服务需求也日益增长。当前网络地理信息系统在空间数据处理和空间信息服务能力上无法满足大量用户的并发访问需求,空间信息服务领域面临着“计算密集”、“数据密集”、“并发密集”和“时空密集”等挑战。云计算是一种新兴的分布式计算模式,是当今IT界的研究热点,其本质是通过互联网将云端的软硬件、数据和平台等资源以服务的方式按需地提供给用户。越来越多的政府、研究机构和公司纷纷采用云计算来解决互联网时代面临的日益复杂的计算和存储问题。为了应对以上挑战,结合云计算模式,空间云计算(Spatial Cloud Computing,SCC)被引入到空间信息领域中。
从云计算服务模型上来说,通常分为软件即服务(Softwareasa Service,SaaS),平台即服务PaaS(Platfromasa Service,PaaS)和基础设施即服务(Infrastruceasa Service,IaaS)三种。除了以上三种服务模式,有时也将数据即服务(Dataasa Service,DaaS)模式单独区分出来,该模式和SaaS处在同一层次,也可将其认为是SaaS的一种方式。空间信息服务应用可以看成是典型的SaaS服务模式的具体应用,如GoogleMap、OpenStreetMap和天地图等广泛应用的在线地图服务及其上提供的开发接口。而在空间信息领域里,空间数据是空间信息服务的核心,使得DaaS模式同样具有深刻的意义。利用云服务模式,用户不需要维护自己的软硬件资源和数据中心,通过瘦客户端和浏览器就可以使用在云端部署的软件应用和服务。
做为空间云计算的基础,空间云计算平台必须具备向用户提供支持海量数据、高并发访问和不间断的在线服务能力。因此,本文将分别对集群服务和矢量并行处理这两个空间云计算平台的关健技术展开研究,具体如下:
1)研究云计算环境下空间信息服务的应用模式,并针对应用模式研究可提供按需配置的空间信息服务的体系构成。进而,在此基础上提出空间云平台服务系统的组成及其在服务层和数据层上可行的关健技术路线。
2)首先,通过分析当前主流商业空间信息服务器集群的架构,对比各种不同架构存在的优缺点,根据空间信息云服务体系在不同层次的需求,设计了基于可扩展子功能集群的空间信息云服务器集群(CloudGISClusterbasedonFunctionalSub-clusters,CGCBSC),并设计了其自动恢复和扩展机制。然后,在组成集群的单节点GISServer服务器的设计中,针对可伸缩、可扩展的需求,采用了多进程的服务实例模式、插件式、标准化的服务组件模式和可扩展的多源异构空间数据源中间件等设计,并且提供了友好的用户开发接口和工具集。最后,通过在普通计算机节点组成的集群上对研究成果进行测试,验证CGCBSC集群的可伸缩性和性能。
3)首先,通过总结当前不同技术路线下并行矢量空间数据处理研究的现状,针对当前还欠缺能够同时处理分析型数据管理业务和事务型管理业务这两种空间业务,且还能够对上层提供友好开发接口的相关研究的现状,结合WebGIS数据应用的特点,提出了基于代理的无共享并行空间数据库管理系统架构(Shared-nothingProxy-basedParallelSpatialDatabaseManagementSystem,SPPSDB)。基于此,设计实现了并行空间查询语言(SSQL),研究了SPPSDB的物理设计及索引实现。进而,结合新兴的MapReduce计算模式的特点,以并行空间连接算法为例,研究了在并行空间数据库上使用MapReduce计算模式实现多表大矢量空间数据集并行分析的可行性和实现方法。基于SSQL开发了并行空间数据操作引擎,并将其集成到上一章设计的多源异构数据源插件中。最后,在实现的SPPSDB原型上,对实现的关健算法和基于SSQL空间数据操作引擎上实现的WMS服务进行测试,论证了相关的研究成果。
在本文最后的空间云计算平台应用研究中,将研究的成果在定制的低功耗、低成本的大规模集群上进行了测试。测试的结果验证了本文的工作成果能为空间云计算平台提供高性能的、可伸缩扩展和配置的空间信息云服务,为SaaS和DaaS空间云服务模式的实现提供了关健技术支撑。