OLAP中智能化的操作符和CUBE压缩技术的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:lfzmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OLAP是数据仓库中重要的分析决策工具之一,它利用独特的多维分析方法,可以有效解决具有多因素、多层次的数据分析问题.目前OLAP技术已经日趋成熟,并得到了广泛的应用.但是,对于日益庞大的数据集来说,有两个问题亟待解决.一是用户靠手工寻找信息的难度很大,OLAP系统需要能够自动地、智能地发现某些模式,使用户的操作更加准确轻松;二是如何设计更有效的CUBE存储、访问方式,使OLAP技术能够推向特大型数据集的应用.OLAP技术的智能化和数据立方体的压缩问题是解决这个问题的有效手段之一.该文旨在探讨如何设计和应用OLAP中智能化的操作符以及如何应用Condensed Cube压缩CUBE数据集.首先,我们研究了智能化OLAP研究现状,详细讨论了几种智能化操作符的功能和实现,并应用MDX技术在Analysis Services下实现了一个智能化OLAP前端分析工具-SOLAP.该系统不仅能够可视化地支持OLAP已有的基本操作,如上卷、下钻、旋转、切片等,而且还支持我们自行设计的TopN和MainDiff智能操作符,用户只要简单地按一个按钮或者输入几个参数,即可获得查询结果中最大或最小的数据单元,找到两个数据单元的底层细节数据的主要差别.然后,我们研究了基于BST技术的CUBE压缩技术-condensed cube.该方法通过识别数据集中各个维组合上的单个元组分组,把具有相同度量值的多个CUBE元组压缩成为一个基本BST元组.我们不但实现了condensed cube中的MinCube和BU-BST算法,而且还设计了新的用于产生最小condensed cube的算法-SQCube.SQCube算法采用两个阶段,在BUCube算法的基础上进行后处理,大大加快了最小condensedcube的生成过程,从而为condensed cube的实用化带来了曙光.试验表明,SQCube算法可以获得condensed cube的最高压缩率,并且压缩速度很快,远远快于原作者给出的MinCube算法.
其他文献
聚类分析是一种原理简单、应用广泛的数据挖掘技术,即把若干事物按照某种标准归为几个类别,其中较为相近的聚为一类,不那么相近的聚于不同类。聚类分析在客户分类、文本分类、基
本文针对国家天文台LAMOST项目的关键技术之一——光纤定位系统开展研究。LAMOST使用4000根光纤实现了大天区多目标观测的世界性突破,远远超出了世界上640根光纤的现有水平,因此对光纤定位也就提出了很高的技术要求。 本文根据工程的要求,首先对光纤定位装置的机械特征、控制方式、定位方法做了分析,然后通过研究现有的几何造型、凸包构建、多边形碰撞判断等算法理论,研究出适合极坐标运动单元的表示
本项目的设计目的就是使用语音处理技术开发一款应用于PDA(Personal Digital Assistant)的英文单词发音训练软件。它不仅可以录音和播放功能便于用户跟读,而且对比用户的发音
微博是基于社交关系来进行信息传播的媒体平台。作为重要的社交网站,微博引发了众多的关注和研究。随着微博平台的蓬勃发展,微博用户规模的不断增大,微博用户的属性、关系和行为
本文介绍了基于Web服务安全规范WS-Security的安全Web设计技术,并提出了新的Web服务安全架构,和给出了一个企业应用集成平台—WSIP的实现。第一章介绍了国内外企业应用集成研究
学位
该文课题是上海宝钢集团公司重点科研项目-热轧过程数字协同仿真技术研究的一部分,主要研究如何建立粗轧过程机仿真系统.文中提出建立热轧分布式仿真系统的必要性.该仿真系统
企业之间可能会因为合作开发一个项目需要共享一些信息资源,因此如何使企业安全有效的访问相互的信息资源便成了一项非常重要的事情。在过去的几年里,电子商务技术经历了快速的
本文首先介绍了J2EE平台的相关内容,最新的Web服务技术的主要组成和与之密切相关的XML技术,以及开发Web应用的技术演进。接着从JSTL规范出发,详细阐述了JSTL各部分的内容和它们
近年来,随着医疗技术的不断发展,医学数字成像和通讯标准-DICOM的日益完善极大的推动了医疗数字影像信息的传输与交换,远程医疗通讯也逐步成为现实.图像存储与传输通讯系统-P