论文部分内容阅读
随着地理信息数据采集设备的发展,空间数据的更新频率逐渐提高,空间数据的管理不仅要满足高效的查询需求,还需要兼顾快速的更新需求。在空间数据更新频率较高的情况下,现有的空间索引通常会导致对磁盘大量的随机读写,严重影响空间索引操作效率,难以满足当前空间数据更新需求。本文面向频繁插入和更新的空间数据,分析当前空间索引存在的缺陷,从空间索引结构和一二级索引实现出发,深入研究当前对空间数据高效更新和查询的需求,克服当前空间索引存在的更新效率低下问题,设计了一种高效更新的空间索引实现方案,为地理空间数据提供底层支持。具体研究内容如下:(1)改进了希尔伯特R树结构,在非叶子结点中存储希尔伯特值范围,提出了“从上至下”查询、“从下至上”调整的批量合并算法,解决了静态希尔伯特R树合并内存需求量过高以及动态希尔伯特R树合并效率较低的问题,达到了R树合并效率高、合并时内存占用较少、合并后空间利用率和查询效率较高等效果。为后续新的空间索引研究提供基础索引结构。(2)提出了将LSM树与改进希尔伯特R树融合实现结合LSM树的希尔伯特R树(LSM Hilbert R-Tree,LH R-Tree),结合内存和磁盘分层管理改进希尔伯特R树,针对LH R树设计了一套高效的索引操作算法,在保证一定的空间查询效率下,解决了空间索引频繁更新效率较为低下的问题,实现空间索引的高效更新。(3)构建了LSM B树与LH R树联动的空间索引。基于LSM B树主键索引和LH R树二级空间索引,结合内存哈希索引建立一二级索引之间的关联关系。克服了LSM B树和LSM R树结合的空间索引在一二级索引操作过程中,会对磁盘中大量索引树进行读写导致操作效率低下的问题,有效提升了整个索引对更新和检索的操作效率。实验结果表明,本文提出的改进希尔伯特R树合并算法,针对性地解决了静态希尔伯特R树所需内存过大和动态希尔伯特R树合并效率和查询效率较低问题,均衡合并效率、内存大小和查询效率这三方面,实现R树的高效合并。构建LH R树,实现与LSM B树联动的二级索引,有效提高了基于LSM树结构下一二级索引的效率。为频繁插入和更新的空间数据管理提供了一套有效的解决思路。