分布式并行计算环境下GML空间数据的划分策略及算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:savages8850
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
GML具有简单性、半结构化、互操作性、开放性、通用性、灵活性等特点,因而在诸多领域得到了广泛应用。随着地理信息领域求解问题的不断拓展,所遇到的问题也越来越复杂,规模越来越大,传统GIS的空间数据存储与空间分析算法的效率优化和性能提升无法满足海量数据的存储与空间运算需求。利用分布式并行计算平台可以很好地解决这一问题。分布式并行系统的优劣很大程度取决于数据划分策略的好坏,而目前空间数据的划分方法没有考虑空间关联关系。因此针对一种适合GML空间数据的综合考虑负载平衡、邻近程度、面积平衡及空间关联关系的空间数据划分方法,本文取得了以下研究成果:第一,研究分析了基于Hilbert空间排列码的空间数据划分和基于K-平均聚类算法的空间数据划分两种算法的缺点。前者在保持各结点的空间数据所占范围平衡性上表现不佳,而后者则由于初始质心的不确定性导致划分结果不稳定。第二,结合Hilbert空间排列码和K-平均聚类算法,并综合考虑对象的空间关联关系提出一种新的GML数据划分算法。该算法考虑了各结点负载平衡、对象的邻近程度、面积平衡及对象间的空间关联关系。最后,根据提出的GML空间数据划分算法,分析设计了GML分布式存储系统,完成了基于Hadoop平台的分布式并行GML存储系统的数据划分模块。通过系统验证了数据划分算法的负载平衡性,并与Oracle Spatial和基于K-平均聚类的空间数据划分算法的并行加速比做了比较分析,与Hilbert码划分算法做了等分区域查询效率对比。结果表明,本划分算法拥有良好的负载平衡性和优秀的并行查询效率。
其他文献
移狱洣江茶场湖南省茶陵县洣江茶场,来了一对名声很大的犯人——潘汉年夫妇。这天是1975年5月29日。将潘汉年夫妇从秦城监狱移于湖南省的劳改单位,是中央专案三办的意见。5
中国共产党的党建理论是马克思主义的党建理论,是一门马克思主义的政治科学,它是在回答历史时代课题中逐步形成和不断丰富发展的。在不同历史时期,它及时回答了一系列的重大历史
土壤侵蚀是指土壤及其母质在水力、风力、冻融、重力等外营力作用下,被破坏、剥蚀、搬运和沉积的过程。遥感与GIS的结合是针对空间数据进行管理操作的信息、系统,本身具有很强
近年来由风沙运动引发的灾害在中国引起了极大的关注,研究风沙运动机理被认为是全面了解和防治风沙灾害的关键因素。因此,本文以荒漠草原为背景,主要研究影响荒漠草原地表风沙流
1994年5月29日,全国人大常委会副委员长、中国民主促进会中央主席雷洁琼参观了韶山毛泽东同志纪念馆。面对着那些特殊的遗物,联想到一代伟人的丰功伟绩,她禁不住感慨万千,挥
江华,1907年8月出生于湖南省江华县大石桥乡鹧鸪塘村的一个瑶族农民家庭.从1928年上井冈山跟随毛泽东干革命,在毛泽东的直接教导和爱护下,江华一步步成长起来,一直到成为中华
世界林产品的供需矛盾日益突出,发展人工林成为各国解决这种矛盾的重要手段。中国大陆广东、广西、海南等17个省区栽种桉树人工林200万hm2以上,居世界前列。桉树人工林能够带来
数据与模型的结合可以提高大尺度模型的模拟效果,为更加准确的评估陆地生态系统的净生产力奠定基础.然而,受现有观测技术和处理方法等问题的限制,不可避免的导致数据在集成过
城市空间结构是城市中一系列社会经济活动相互作用后在城市地域内的反映,是城市布局和形态在空间上的物质表现形式。城市发展中各类活动因素都与城市的空间结构形成有着千丝
根据现代生物技术开发周期长、发展阶段多、高技术风险和高市场风险并存的特征,以阶段门模型为基础,构建了改进的二项式实物期权定价模型。与传统二项式模型相比,改进后的模