论文部分内容阅读
联机分析处理(Online Analytical Processing, OLAP)是建立在数据仓库基础上的一种支持多维分析的决策支持工具,也是用户获得决策支持的主要手段。随着时间的推移和数据量的积累,传统的OLAP技术架构有待进一步改进才能更好的满足用户的决策分析需求。在Peer-to-Peer技术不断成熟的今天,利用多个OLAP网络节点之间的多维数据集(Data Cube)进行协调合作来完成决策分析,不仅可以极大地提高OLAP查询分析的效率,而且可以均衡OLAP服务器的负载。在实际的应用运行中,如何去实现P2P环境下各个节点之间的协同合作成为了数据仓库应用中的关键问题。本文根据上面提出的问题,建立了一种P2P网络中OLAP节点的决策需求由多个其它OLAP节点共同提供服务的模型,打破原来由单一服务器服务的方式,提升了OLAP决策分析的效率,均衡了OLAP服务器的负载。该模型主要是通过以下三个方面的设计来实现:(1)在已有的多维数据集优化存储策略的基础上,根据P2P环境的特点,利用多维数据集的维层次链的特性,本文提出将多维数据集按照语义维层次链和扩展语义维层次链的CSMD-Tree(Compress Semantic Multi Dimension-Tree,语义压缩多维数据树)模式进行Data Cube存储,能方便有效地实现P2P环境下不同节点之间的多维数据集的共享。(2)通过构建P2P环境下的OLAP网络框架结构,灵活地实现OLAP节点的动态加入和退出,并提出了一种按照扩展语义维层次链的多维数据集分布式查询DQDC (Distributed Query Data Cube)分析算法。该算法实现了P2P网络中语义级的多节点Data Cube数据共享,从而提高了P2P环境下的整体决策分析性能。(3)根据P2P网络环境的结构特性以及OLAP节点对多维数据的分析需求,将OLAP网络节点按照节点之间需求是否相同来进行兴趣划分。通过构建基于兴趣的虚拟层次网的基础上,提出了一种基于OLAP节点兴趣协助IADS(Interest Assist Data-Cube Search)的查询分析算法。该方法可以减少OLAP节点在进行查询分析时对多维数据集的搜索范围,进一步优化了P2P环境下对多维数据集的决策分析效率。