数据仓库中的索引技术

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:chenglian_chen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了能更好地支持决策分析,发挥数据的更大价值,数据仓库技术应运而生。其中,联机分析处理(OLAP)是数据仓库最主要的应用之一。本文从提高数据仓库和OLAP系统性能的角度出发,讨论了基于关系存储的多表连接,研究了目前数据仓库系统比较流行的索引技术,并对位图索引进行了全面的研究。文章研究了B树索引、位图索引、索引组织化表、B~*树群索引在数据仓库中的正确应用,并就这几种索引技术的优缺点进行了分析,同时提出了在数据仓库中创建和维护索引的一些建议。位图索引是一种比较重要的数据仓库索引技术,主要基于二进制逻辑运算的简化操作来达到查询优化的目的,位图索引的主要特点是查询效率高,实现起来比较简单,具有很强的可操作性。然而在一些场合,也有不太适合的地方。位图索引不太适合数据仓库中的范围查询,最主要的特点是占用了较多的空间,本文提出了编码位图索引在范围查找中的应用,并实现了算法。实验证明,算法取得了预期的效益。基于关系存储的联机分析处理(ROLAP)通常会涉及多表连接操作。由于基于关系存储的数据仓库一般采用星型结构组织数据,所以传统的多表连接方法已经不太适合ROLAP查询的需要。本文研究了目前较新的多表连接方法,例如多表哈希连接算法、多表排序连接算法,它们结合了星型的特点,极大地提高了效率。本文提出了基于位图索引的多表连接算法,并加以实现和改进,这种算法能够极大地提高联机分析处理的速度,实验证明,算法达到了预期的目标。总的来说,数据仓库中的索引技术,是一个比较新的课题,每种索引各有所长,在数据仓库中要综合考虑,选择恰当的索引。
其他文献
在目前的加密方法中,椭圆曲线加密方法具有安全性高、密钥长度短、加密和解密速度快等优点,其必将成为当今密码学领域中最具前途的加密方法之一。从讨论信息安全需求开始,在
Ad Hoc网络是由一组带有无线收发装置的移动节点所组成的临时性多跳自治系统,在军事和民用领域具有广阔的应用前景。近年来,随着各类多媒体业务及实时业务的普及和推广,要求网络
本文从研究以电力企业为代表的电力系统信息化现状入手,详细调查了目前电力企业信息化的现实条件、系统分析了当前信息系统存在的不足以及新形势下进一步发展面临的各种困难,
生成高度真实感的虚拟自然场景一直是图形学研究领域中一个富有挑战性的难题。作为自然场景的重要组成部分,地形真实感模拟逐渐得到人们的广泛重视。本论文实现了一个三维分
由于Internet的广泛应用,基于Internet的网络战已经成为信息战的一种重要形式。为了在未来的网络战中掌握主动权,网络攻击技术是不可或缺的网络战武器,而要进行成功的网络攻击,首
数据中心已成为全球信息化建设的基础支持设施。功率供应是建造数据中心的最大限制之一,是数据中心昂贵的资源。然而部署了大量延迟敏感型应用的数据中心功率利用率低下问题一
J2EE服务架构已成为当前行业应用软件开发的主流架构,然而在实际的应用中,J2EE构架的重量级组件却给系统开发和测试带来了很大的困难,以致造成了很多项目的失败。近年来,集成了多
生物识别技术在当今世界中已经得到了广泛的应用。虹膜身份识别是一种新兴的生物身份识别技术,由于其具有唯一性、稳定性、可采集性、非侵犯性等优点而逐步受到人们的重视。与
关联规则是数据挖掘技术的一种方法,侧重于确定数据集中不同属性之间的联系,找出满足给定支持度和置信度阈值的多属性之间的依赖关系。这样的规则可以应用于商品货架设计、存货
在当前科研机构的日常办公中,对科研信息的管理是非常重要的工作。对于大量的科研信息,如何能够快速的检索到用户真正感兴趣的内容,成为近些年来学者研究的一个热点。目前,国内外