论文部分内容阅读
随着商业竞争的不断加剧,商业智能系统在各种商业领域的运行中扮演着越来越重要的角色。商业智能是基于数据仓库、ETL、OLAP和数据挖掘等技术发展起来的,其实质是从大量的历史数据中有效地提取信息,进而从这些信息中发现潜在的、有用的知识,为企业指导业务行为并进行辅助决策,以便在激烈的商业竞争中赢得主动和更多的商机。本文首先简要介绍了商业智能相关技术基础,包括数据仓库,ETL,OLAP,和数据挖掘技术的相关概念,特征。接着围绕如何提高商业智能系统的查询效率,减少数据占用的存储空间,以及如何建立关联规则挖掘模型开展了商业智能相关关键技术的研究。主要包括:1、遗传算法在物化视图中的应用研究。物化视图是提高数据仓库执行效率的有力方法,但是物化视图的保存会占用存储空间。本文把查询需要扫描的物化视图或事实表的空间大小作为查询时间开销,设计了基于遗传算法的物化视图优化算法。目的是使系统在物化视图方面的存储开销和查询时间开销的和最小。2、多维数据存储结构的研究。多维数据的逻辑组织方式是OLAP实现的关键之一。本文对这个问题进行了深入的研究,总结了多维数据的两种组织方式——关系方式和数组方式,重点研究了在数组方式中多维数据的存储结构、多维数组的建立方法、稀疏数组的压缩方法、数组分块的原则和分块数组访问方法,并在以上的理论分析的基础上提出了一个数组方式存储的方法。3、基于Apriori算法的关联规则挖掘模型研究。OLAP技术是共享多维数据的快速查询和分析技术。本文通过分析Apriori算法的特点,提出一种有针对性的OLAP关联规则挖掘模型。该模型在数据立方体维度和度量值设计上充分考虑Apriori算法的特点,使数据立方体物化更多算法所需要的中间数据;同时适当改进算法使之适应所设计的数据立方体。研究表明该设计方法在灵活性和效率方面较传统算法具有较好的表现。本论文以商业智能应用为背景,以优化商业智能中的关键算法作为研究目标,提出了一些创新的技术方法,最后对研究工作进行了总结并对进一步的研究工作提出了展望。