论文部分内容阅读
OLAP是数据仓库中重要的分析决策工具之一,它利用独特的多维分析方法,可以有效解决具有多因素、多层次的数据分析问题.目前OLAP技术已经日趋成熟,并得到了广泛的应用.但是,对于日益庞大的数据集来说,有两个问题亟待解决.一是用户靠手工寻找信息的难度很大,OLAP系统需要能够自动地、智能地发现某些模式,使用户的操作更加准确轻松;二是如何设计更有效的CUBE存储、访问方式,使OLAP技术能够推向特大型数据集的应用.OLAP技术的智能化和数据立方体的压缩问题是解决这个问题的有效手段之一.该文旨在探讨如何设计和应用OLAP中智能化的操作符以及如何应用Condensed Cube压缩CUBE数据集.首先,我们研究了智能化OLAP研究现状,详细讨论了几种智能化操作符的功能和实现,并应用MDX技术在Analysis Services下实现了一个智能化OLAP前端分析工具-SOLAP.该系统不仅能够可视化地支持OLAP已有的基本操作,如上卷、下钻、旋转、切片等,而且还支持我们自行设计的TopN和MainDiff智能操作符,用户只要简单地按一个按钮或者输入几个参数,即可获得查询结果中最大或最小的数据单元,找到两个数据单元的底层细节数据的主要差别.然后,我们研究了基于BST技术的CUBE压缩技术-condensed cube.该方法通过识别数据集中各个维组合上的单个元组分组,把具有相同度量值的多个CUBE元组压缩成为一个基本BST元组.我们不但实现了condensed cube中的MinCube和BU-BST算法,而且还设计了新的用于产生最小condensed cube的算法-SQCube.SQCube算法采用两个阶段,在BUCube算法的基础上进行后处理,大大加快了最小condensedcube的生成过程,从而为condensed cube的实用化带来了曙光.试验表明,SQCube算法可以获得condensed cube的最高压缩率,并且压缩速度很快,远远快于原作者给出的MinCube算法.