论文部分内容阅读
基于Shared-Nothing结构的并行数据库系统具有良好的可扩展性,既能满足海量数据的存储要求,也能提供高效的查询处理性能,因而得到了广泛的应用。在并行数据库的研究中,负载平衡对于查询处理的性能有着很大影响,本文致力于并行数据库负载平衡技术的研究。 并行数据库负载平衡技术分为静态负载平衡和动态负载平衡两种。数据划分和数据重组技术都是有效的静态负载平衡方法。本文的研究内容主要包括并行数据库的数据划分策略、数据重组策略和动态负载平衡技术。 目前已有的并行数据库数据划分选择算法均是根据预知的查询负载给出优化的数据划分方案,不能适应系统查询负载的变化。本文提出的数据划分选择算法,能够随着数据库查询负载的变化动态选择并行数据库的数据划分策略,使得数据库的整体查询性能保持最优。本文还提出了一种RCMD数据划分策略,可以有效地支持多种类型查询。 并行数据库数据划分的调整会导致代价昂贵的数据重组。目前的数据重组方法在数据重组期间,不能保证对查询请求的快速响应。本文提出的数据迁移和数据重组算法以及在线重组期间的查询处理方法,能够有效地支持在线重组期间对用户查询的快速响应。 在动态负载平衡研究方面,本文提出了动态负载平衡的Join和Aggregation算法。这两种算法根据各结点当前的负载状况调度任务的执行,平衡各结点的负载,提高了操作执行的效率。理论分析和实验结果证明,本文提出的方法能够有效地解决并行数据库的负载平衡问题。