多维数据的存储机制研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户：xiaoliang668

【摘要】

：

该文针对MOLAP目前面临的分析数据量大、数据稀疏度高、维度多、要求增量更新等问题,开展了多维数据存储机制和基于多维数组的Data Cube计算方法等方面的研究及其相应实现.

【作者】

：

张成亮

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2002年期

【关键词】

：

联机分析处理数据立方体稀疏数组多维数据存储

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文针对MOLAP目前面临的分析数据量大、数据稀疏度高、维度多、要求增量更新等问题,开展了多维数据存储机制和基于多维数组的Data Cube计算方法等方面的研究及其相应实现.主要的研究内容和成果如下：●针对大数据量分析要求和具体操作系统的限制,利用文件拼接、数据分块、有效压缩等方法,建立了一个层次化的动态存储体系.●针对大数据量Data Cube的快速检索和增量加载的需求,提出并实现了ChunkIndex-BTree索引机制.●在现有Data Cube计算方法的基础上,针对大数据量、复杂高维的特点,给出了改进的Data Cube计算方法,实现了Data Cube的高效计算.●设计并实现了基于MOLAP的多维数据管理的原型系统MagicBase.在上述方法研究的基础上,设计并实现了一个多维数据管理的原型系统MagicBase,实验表明系统具有良好的性能.

其他文献

移动电子政务系统中知识管理技术的研究和实现

随着社会发展，电子商务正成为现代商务的主流，而政府作为社会主要信息的收集和发布者，如果其信息化应用水平跟不上企业和社会上信息发展的步伐，信息化应用水平跟不上企业和社会信

学位

电子政务物理隔离主动信息服务数据挖掘信息决策

软件测试管理系统的研究和实践

现在的软件系统对软件质量的要求越来越高.如何提高软件质量有两个关键因素：过程质量的控制和软件产品本身的质量.在传统的软件测试中,比如V模型,人们只对软件产品本身进行测

学位

软件质量软件测试TMM过程质量管理

软件缺陷报告的管理与挖掘技术研究

软件维护占据了软件产品的很大一部分成本，以往的研究显示软件维护消耗了70％左右的软件开发成本。随着现代软件工程的发展，软件缺陷(bugs)是不可避免的产物。修复软件缺陷是软件

学位

软件维护缺陷报告自动化管理信息挖掘

网上车险理赔系统的设计与实现

90年代初期是客户/服务器模式的鼎盛时期,大多数金融、电信企业采用这种技术,组建企业内部网,这种架构分为客户机、服务器两个层次,其主要特点是:客户端:提供用户操作界面,接

学位

车险理赔系统系统设计网络

面向电子商务的可信推荐系统若干关键技术研究

随着电子商务的发展，电子商务系统所包含的商品信息越来越多，给电子商务系统的用户带来了所谓的“信息过载”问题，即用户需要过滤掉越来越多的无关内容才能找到自己感兴趣的商品

学位

电子商务可信推荐系统商品信息用户兴趣

科学数据库元数据处理的关键技术研究

该文撰写的背景是中国科学院“十五”重大科研项目--科学数据库及其信息系统.该文的主要研究成果包括（1）综合的考察并分析了科学数据库对元数据标准的需求,为科学数据库中如何

学位

科学数据库XML半结构化数据元数据处理

分类、聚类算法的研究与实现

该文对数据挖掘中的分类和聚类方面的技术进行了初步的探讨和研究,对部分算法进行了实现和改进.其中,分类采用的核心方法是二叉的决策树归纳,一个重要的设计原则是对较大的数

学位

数据挖掘分类聚类

移动代理安全性研究

该文提出了对移动代理系统安全性的要求,论述了目前已提出来的保护代理平台和保护移动代理的技术,分析比较了这些技术的优缺点和实用性.该文从分析代理平台对移动代理攻击的

学位

移动代理匿名性群签名电子商务Agent技术

改进的篇章微观结构分析及参数优化方法

通过对文章中关联词的分析,针对关联词的各种逻辑关系,按照一定层次分析出文章的层次结构关系.通过与已有的语义分析模型相结合,完成文摘模型的建立.对其进行参数优化以后,利

学位

自动文摘最大匹配依存关系权值遗传算法关联词权值

基于P2P的文件共享系统

对等计算（P2P:Peer to Peer）近来在文件共享的实现方面得到了广泛的应用.该文提出和引入几个使基于P2P的文件共享系统性能得到有效改进的新技术,并且实现了一个应用这些技术的P

学位

对等计算内容匹配带宽聚合前向纠错

多维数据的存储机制研究与实现

与本文相关的学术论文