前缀立方的计算和存储

被引量 : 0次 | 上传用户:showfeeling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了加速响应联机分析处理系统中的复杂多维查询,通常需要预先计算并保存数据立方。然而数据立方的巨大尺寸却给数据立方的计算和存储带来诸多难题。为了保存数据立方不得不消耗大量的存储空间;同时在计算数据立方所耗费的时间代价中,占支配地位的就是用于存储数据立方的结果集所带来的大量I/O操作。为了从根本上解决这些问题,需要探索有效的数据立方计算和组织方法。浓缩数据立方(Condensed Data Cube)是一种有效缩小数据立方尺寸的机制,其中基本单元组的浓缩(BST Condensing)是指把那些由同一条基表元组计算聚集得到的立方元组浓缩成一条,从而减小数据立方的体积,基本单元组的浓缩实质上又是一种特殊的前缀共享。小方内的前缀共享技术(Prefix Sharing)通过消除同一数据小方内元组之间的前缀冗余来进一步压缩数据立方。将这两种前缀共享技术结合,就得到了一种新的数据立方组织结构-前缀立方(PrefixCube)。PrefixCube把基本单元组浓缩数据立方中的立方元组按数据小方聚簇,然后消除数据小方内的前缀冗余,在减小数据立方存储开销的同时,通过减少数据立方计算过程中的I/O代价,加快数据立方的计算速度。在计算PrefixCube的过程中,为了识别元组间的共享前缀而不得不进行大量的元组间的比较,这对加快PrefixCube的计算是十分不利的。针对这一问题提出了两种优化策略,即消除单聚集维小方中元组的比较和以批处理模式消除同组生成的元组之间的比较,来进一步优化PrefixCube的计算。在实际的联机分析处理系统中,基于维层次的上卷、下钻操作是十分常见也是十分重要的,而维的层次性使得数据立方的计算变得更为复杂。通过扩展PrefixCube的计算方法和组织结构,实现了层次前缀立方(Hierarchical PrefixCube,HierPrefixCube)的有效计算和组织。
其他文献
为了实现信息系统的自动化巡检,文章分析论述了信息系统运维巡检工作的现状,并提出通过开源实时监控工具ZABBIX提取信息系统基础资源指标,在此基础上研究出一套自动化巡检系
长江上游地区既是我国经济发展相对落后的区域,也是生态环境相对脆弱的地区,这一地区在西部大开发中同时承担着建设长江上游经济带和长江上游生态屏障的双重任务。如何在保护生
商业银行在国家的金融体系中占有核心地位。中国的金融体系属于大银行主导模式,银行信贷为中国的企业提供了90%以上的融资。但是中国国有商业银行存在严重的不良资产问题。继
本文分析了我国近年来上市公司资产重组存在的问题和国外企业重组的发展历史、特征及其对我国的启示,从产业结构调整的角度阐明了上市公司资产重组的发展方向和今后的热点---
自古以来,对于教育理念有着许多不同的理解,但大致可分为两类:一是以教师为中心,片面强调教师和教材的作用;二是以学生为中心,强调激发学生内心向学的积极性。不同的教育理念
<正>地理教学设计是在阅读分析教材和查阅教学资料以及教学人员通过深思熟虑后,定下教学方案,是备课最重要的环节。笔者就初中地理教学谈谈自己的见解。一、板书设计有效性在
在我国将发展现代服务业提升到全国战略层面的情况下,本文首先对现代服务业的重要构成部分——现代物流业的内涵进行了界定;其次,对现代航空物流业和现代海运物流业的特点和
采用Agilent C18柱和紫外检测器,以甲醇+水为流动相,测定试样中虫螨腈和虫酰肼有效成分质量分数。结果表明,虫螨腈和虫酰肼的线性相关系数分别为0.999 5和0.999 2,标准偏差分
目的研究同型半胱氨酸(Hcy)、超敏C反应蛋白(hs-CPR)、B型利钠肽(BNP)、D-二聚体与急性冠状动脉综合征(ACS)的相关性。方法选择2011年8月至2014年8月240例经冠状动脉造影方法诊断为AC
1. B1、B2等几株芽孢杆菌(Bacillus spp.)的生长动态及其抑菌机理B1、B2、B3、B4、B6的菌体生长量(OD600)及其拮抗活性物质产生最佳时间为:B1、B2、B3 菌体生长量(OD600)在24h达到最