基于Phoenix平台的空间数据索引与查询技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cyuch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社会经济的快速发展,智能手环、滴滴出行、外卖点餐等众多地理信息系统相关应用大量出现,导致地理空间数据大规模产生。人们在日常生活中越来越依赖于空间数据,空间大数据时代已经到来。传统关系型数据库由于单机存储容量有限,无法处理海量数据。因此,近年来出现了以Hadoop、HBase、Phoenix等为代表的分布式平台。Phoenix平台基于HBase,具有易理解的二维表模型、强大的SQL语言、高效的二级索引、分布式水平扩展等优良特性,但不支持空间数据的组织和管理。针对上述问题,本文提出了一种新型的空间数据管理方案——SpatialPhoenix。该方案选取Phoenix作为基础开发平台并对其进行空间扩展,增加空间数据预处理、存储、索引、查询等空间操作,结合GeoTools开源组件,设计并实现标准的空间数据访问接口,使应用层可以方便地对Phoenix平台中的空间数据进行读写和查询。本文主要工作如下:(1)空间数据存储模型的研究与设计。基于Phoenix分布式平台,研究并设计了空间数据存储模型、空间数据预处理模块和空间数据导入模块,以完成空间数据存储操作。(2)空间索引算法的研究与设计。基于空间数据存储模型,选取Geohash编码作为空间索引算法,并结合Phoenix二级全局覆盖索引,为后续空间查询算法提供空间索引基础。(3)空间查询算法的研究与设计。基于空间数据存储模型和空间索引算法,研究并设计了两种空间查询算法,分别是范围查询算法和kNN查询算法,二者都采用“三步走”策略,即分为预处理、过滤、精炼三个阶段,且将过滤和精炼阶段都放到服务器端执行,从而可以大大提高空间查询效率。(4)空间数据访问接口的设计与实现。基于Phoenix分布式平台,设计并实现了与GeoTools对接的空间数据访问接口,使得应用层可通过GeoTools管理和分析Phoenix平台中的空间数据。为了评估SpatialPhoenix方案的有效性,本文搭建了Phoenix分布式平台,选取PostGIS作为实验对比平台,采用空间点数据集,对空间数据导入方式和空间查询算法进行了多项测试。实验结果表明,SpatialPhoenix方案具有更高效且更加稳定的数据导入方式。当空间数据集和查询结果达到一定规模时,SpatialPhoenix方案具有更加高效的空间查询方式。
其他文献
我国北纬30°以北的河流在冬季都会结冰,建立在水中的桥梁不可避免的会受到水中结冰的影响甚至威胁桥梁安全,本文以北京北部永定河落坡岭水库上的落坡岭桥为研究对象,对落坡
动补式动词是汉语中一种重要的复合词,从结构上说,主要是“动+动/形”的形式,从语义上讲,动词与补语之间是一种补充说明的关系,补语成分说明动作行为的结果、趋向、状态等,或
现如今,人们对高能耗应用的先进储能技术有越来越迫切的需求,像电动汽车和智能电网存储系统,已经引起研究者们对传统锂离子化学新电池系统的不断探索。因此,可充电锂金属电池
视觉目标跟踪在机器视觉领域中作为一项前沿技术,是实现人工智能的重要组成部分,其主要涉及到图像处理、信号处理、模式识别等专业知识,且目前已广泛应用于安防监控、视觉检
随着互联网的普及与规模的持续增长,数据的刻画形式越来越复杂。传统的算法大多将数据展开成一维向量,再使用基于向量的算法对数据进行处理,这样不仅破坏了数据结构,也为后续
我国经济的快速发展,城市汽车日益增多,带来了一系列严重的交通问题。智能交通系统是改善交通问题的有效途径,车辆检测是智能交通系统中重要的研究课题。然而车辆检测受光照
大量实验结果表明波在含重油孔隙介质中的传播性质随温度改变有较大变化,温度对波传播性质的影响不能忽略。为了研究含重油孔隙介质中波传播性质随温度的变化,本文综合考虑了
在水资源匮乏,社会经济高速发展的大背景下,我国的水资源供需矛盾日益突出。我国北方缺水地区,修建的很多多孔拦河闸以及多孔蓄排兼用水闸,除在汛期过流量大时可能全部开闸放
随着网络的迅速普及,网络应用多样化趋势加快,大数据时代已经到来。数据的急剧增加使得推荐系统中的用户数和项目数也大大增加,相对来说可用的评分所占比例将越来越小,评分矩
数据不仅仅是信息的一种表达方式,更是潜在信息的载体。低维度的数据集通过传统数据库的方法很容易查询。近年来,数字化和网络化带来了数据的繁荣,图像和视频数据在整个大数