论文部分内容阅读
为了能更好地支持决策分析,发挥数据的更大价值,数据仓库技术应运而生。其中,联机分析处理(OLAP)是数据仓库最主要的应用之一。本文从提高数据仓库和OLAP系统性能的角度出发,讨论了基于关系存储的多表连接,研究了目前数据仓库系统比较流行的索引技术,并对位图索引进行了全面的研究。文章研究了B树索引、位图索引、索引组织化表、B~*树群索引在数据仓库中的正确应用,并就这几种索引技术的优缺点进行了分析,同时提出了在数据仓库中创建和维护索引的一些建议。位图索引是一种比较重要的数据仓库索引技术,主要基于二进制逻辑运算的简化操作来达到查询优化的目的,位图索引的主要特点是查询效率高,实现起来比较简单,具有很强的可操作性。然而在一些场合,也有不太适合的地方。位图索引不太适合数据仓库中的范围查询,最主要的特点是占用了较多的空间,本文提出了编码位图索引在范围查找中的应用,并实现了算法。实验证明,算法取得了预期的效益。基于关系存储的联机分析处理(ROLAP)通常会涉及多表连接操作。由于基于关系存储的数据仓库一般采用星型结构组织数据,所以传统的多表连接方法已经不太适合ROLAP查询的需要。本文研究了目前较新的多表连接方法,例如多表哈希连接算法、多表排序连接算法,它们结合了星型的特点,极大地提高了效率。本文提出了基于位图索引的多表连接算法,并加以实现和改进,这种算法能够极大地提高联机分析处理的速度,实验证明,算法达到了预期的目标。总的来说,数据仓库中的索引技术,是一个比较新的课题,每种索引各有所长,在数据仓库中要综合考虑,选择恰当的索引。