论文部分内容阅读
数据仓库是一种语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需信息。本文所阐述的是面向环保领域的分布式数据仓库系统的设计与实现,以及在数据仓库系统的基础上进行相关查询的分析方法,并将GMDJ(General Multi-Dimensional Join,通用的多维联接)技术引入了MIS(Management Information System,简记为MIS)领域。首先对数据仓库与联机分析处理技术作了简单介绍,然后详细说明了环保领域数据仓库以及多维数据集模型的设计。针对一系列大气监测指标的分析要求,建立了大气分析系统的立方体模型,并提出了分布式数据仓库的结构设计和OLAP分析。最后探讨了GMDJ技术在哈尔滨市环保局大气分析系统中的具体应用问题。并在此基础上,采用GMDJ技术解决了实际应用中遇到的OLAP(Online Analytical Processing,联机分析处理)查询问题。举例说明了用GMDJ表示OLAP查询任务以及立方体的方法,以高度简洁的代数形式表达了十分复杂的OLAP查询任务,从而提高了系统的查询响应速度,优化了系统的性能。本文所设计的数据仓库符合数据仓库的设计原则,通过建立数据仓库可以为联机分析提供数据源并且帮助我们更有效地分析数据。联机分析查询系统的主要任务是以多维数据模型为基础,建立多维数据集,实现对多维数据集的查询。为了将查询结果展现给用户,在文章最后设计给出了基于GMDJ的集成查询系统,该系统内嵌了GMDJ查询引擎,使分析结果更加直观,极大地方便了用户。通过该系统验证了基于GMDJ的分布式数据仓库集成查询技术的有效性和可行性,对仿真结果进行了分析。上述研究不仅是对原有系统的补充和完善,而且具有很大的实际应用价值,较好地完成了系统初期的设计目标。