论文部分内容阅读
数据仓库索引技术是基于传统数据库索引技术发展起来的数据仓库查询优化方法。数据仓库索引技术主要有树形索引和位图索引两种方法。本文就这两种索引结构的主要特点,应用范围和发展前景作了一些深入的探讨和研究,为这两种数据仓库索引技术的广泛应用奠定基础。 树形索引结构是适用于高基数维属性的索引技术,R-树索引基于传统B-树索引技术而发展成为主流的数据仓库多维索引结构,具有结构简单、易于维护及适用范围广等优点,缺点是索引子空间重叠数据过多,导致查询路径失效,影响查询性能。四叉树是用超平面的方法来组织索引结构的一类索引机制,具有查询速度快,插入和删除操作简单方便的优点。QR-树索引结合四叉树和R-树的各自优点,既可以满足较高的存储效率,又避免太多的无效查找,达到较好的查找性能。为此,我们在这里特别讨论数据仓库的一种新型多维索引—QR-树索引,分析其多维索引结构的特点,给出其插入,删除及查询操作伪码算法,并与R-树索引的操作性能进行比较,实验证明,QR-树索引是一种比较理想的多维索引结构,将会有良好的发展应用前景。 位图索引是另外一种比较重要的数据仓库索引技术,主要基于二进制逻辑运算的简化操作来达到查询优化的目的。位图索引的主要特点是查询效率比较高,实现起来比较简单,具有很强的可操作性。主流的位图索引技术是分段位图索引,分段索引降低了索引存储的空间开销,但也增加了扫描位图的个数,为了平衡这两者之间的矛盾,可以采用二进制逻辑运算的合并简化操作来实现优化查询的目的。本文就位图索引的成员查询合并简化算法作了一些改进,使得算法的效率得到了一定程度的提高,实验证明,算法的改进有效地优化了查询过程,取得了预期的效益。 总的来说,数据仓库的索引技术还是一个比较新的课题,R-树索引和位图索引各有所长,综合这两种索引的特点而设计的混合索引也有比较好的查询性能,是一种适用性很广,很有发展前途的索引技术。