云计算环境下大GML空间数据并行存取关键技术研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:airbter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对地观测、移动GIS、互联网、物联网等技术的成熟以及GML使用领域不断拓展,GML空间数据正在井喷式增长,其数据量正在从GB级跃升至PB乃至EB级,大GML数据时代正在来临。而传统空间数据库的计算及I/O能力难以满足大GML数据所需的高性能处理需求。近几年流行的云计算技术拥有超大规模、高可扩展性、高可靠性和通用性等特点;同时No SQL在大数据背景下朝气蓬勃,它是同时支持结构化和半结构化数据存储的一种非关系型分布式数据库。因此,云计算技术和No SQL技术为半结构化大GM空间数据的并行存取问题赋予了全新的解决途径。本文利用开源云计算平台Hadoop以及分布式数据库HBase研究了大GML空间数据在分布式计算环境下并行存取的关键技术。主要借助Hadoop平台及HBase等软件对大GML空间数据的存储与查询做了以下几点研究。(1)分析现有空间数据划分算法,结合传统GML存储管理思想和GML数据所拥有的特点,兼顾地理要素几何以及拓扑关系等的完整性,研究适合云计算平台下大GML空间数据动态划分算法策略。(2)结合现有云计算技术及No SQL技术,设计了适合在HBase中存储GML空间数据的一种存储模型;分析Hadoop的分布式文件系统架构及其数据副本的放置策略,改进HDFS默认数据副本放置方法,并对分布式文件系统进行扩展使其能够确保地理要素的几何完整性。(3)深入研究传统空间数据索引机制,综合并行空间索引算法和GML空间数据划分算法,基于四叉树和R树索引机制设计了一种适合GML空间数据的两级并行空间索引结构。(4)分析GML数据所具有的特点以及Map Reduce并行计算模型;并结合HBase数据库与传统空间数据库的查询优化技术;然后综合考虑GML数据分布式存储时采用的划分策略,研究云平台下适合大GML空间数据并行查询算法及策略。最后,通过实验测试并对其性能及效率进行分析,得出本文设计的GML空间数据划分算法、存储模型、并行索引机制和查询算法都具有良好的性能。
其他文献
河势分析为河道整治、防洪、岸线资源利用以及深水航道建设等诸多工作提供支持。论文旨在是研究河势分析的理论与方法,重点研究基于数字河道的河势分析方法。 论文针对尚无
茶树“矮、壮、阔”树型是丰产、优质茶园的主要特征。而形成“矮、壮、阔”树型的关键技术措施是对茶园进行综合修剪法。由于茶树修剪劳动强度较大,加上大量农业劳动力进城
当大众不惜改变日常生活节奏来收看重大体育赛事的电视直播时,这种直播就体现出某种仪式性。它符合媒介事件的语境,涵盖了电视体育直播的即时性、观众的参与感和内容的共享性
本文通过对荣华二采区10
期刊
近年来,莱阳市人大常委会不断加强对群众普遍关注、政府着力推动等重大事项的监督,取得明显成效。受经济利益驱动等因素的影响,该市乱采滥挖、浪费矿产资源等违法行为时有发
马克思主义关于人的本质的科学理论认为,人的社会本质是人的社会特质,是自由自觉的活动,人的本质在其现实性上,是一切社会关系的总和。人作为现实中的个人,其存在和发展取决于和他
流域水生态环境的破坏会影响流域内社会经济的可持续发展。为协调流域内各方利益关系,促进生态保护与恢复工作,流域水生态补偿制度的设计与实践越来越受到关注。本文通过对湘江流域水生态补偿中的成本分析及其分担计算,为该流域建立水生态补偿机制提供科学基础,其主要研究结果与结论如下:(1)初步确立流域水生态补偿的成本量化体系流域水生态补偿的成本分为直接成本与机会成本两个部分。直接成本的量化主体为政府,机会成本则
学位
DEM误差在地形分析过程中被放大和传播,误差具有空间自相关性。DEM误差空间自相关性会影响人们对地学模拟过程中的解释和判断,会影响数字地形分析的结果。“在空间分析过程中,不
随着Internet技术的不断发展和人们对地理信息系统(GIS)需求的日益增长,利用Internet在Web上发布空间数据,为用户提供空间数据浏览、查询和分析功能,已经成为GIS发展的必然趋
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊