论文部分内容阅读
随着互联网的快速发展,互联网应用越来越依赖于支持高吞吐量和海量可扩展性的数据管理系统。近年来,云环境在解决海量数据的高效管理方面正得到越来越多的关注。当前,有若干提供各种服务的云环境。不过,由于缺乏高效的索引结构,当前的云环境只支持简单的基于关键字的查询。为了提供高效的数据管理,需要有一个高效的、可扩展的索引方案。
本文调研了近年来分布式索引的相关研究现状,分析了云环境中设计高效的分布式索引的特点和难点,提出了一种云环境中基于主从架构的分布式索引方法。
本文的主要工作包括:
●结合云环境的特点,提出了一种高效的、可扩展的分布式索引方法。本文的方法可以概括如下,首先为每一个计算节点管理的数据建立局部的B+树索引,然后在主节点上用R树来管理这些B+树的范围信息。
●设计了高效的索引查找和索引维护的算法。在索引查找中,利用对计算节点的并行处理提高效率。此外,对从节点上的数据进行查找时,采取了批量查找和批量返回的策略,节省了大量的网络通信开销。
●利用多副本策略提高索引系统的并发性,采用了异步的数据副本一致性维护策略,为系统提供了最终一致性。
通过在模拟实验环境下进行的对比实验分析,本文的索引方案是非常高效和可扩展的。