Spark环境下的分布式OLAP查询

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:HOHO333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据立方体是数据仓库的核心数据模型,其元组可以划分为封闭元组和非封闭元组,通过去掉非封闭单元进行压缩并分层形成了分层封闭立方体.以Hadoop为主的云计算环境通常以离线批量计算为主,查询分析有一定的延迟,不能达到OLAP的在线性和交互性.Spark是一个基于内存的快速通用的大数据并行计算框架,对此本文基于分层封闭立方体,利用Spark,设计和实现了两种有效的分布式OLAP查询算法:SLCCQuery及其优化算法SLCC_Layered Query.不同参数的数据集上的实验验证了本文提出的Spark环境下的分布式OLAP查询算法的有效性及其优化算法的相对高效性.
其他文献
作为多民族国家的西班牙因为在佛朗哥独裁统治结束后,坚定地以非中央集权的过渡方式实现民主化,并发展出颇具特点的区域自治制度,有效缓和国内各民族的紧张关系,而被国际社会视为多民族国家内部不同族群间关系治理的成功范例。但是因为与西班牙之间存在着错综复杂的历史、民族与经济关系,加泰罗尼亚地区一直存在着扩大自治权的诉求,长期以来双方在各自立场上毫不妥协,未能以有效的方式处理分歧,导致矛盾逐渐加深,政治互信降
从“四步十六字”教学法的内容、应用案例、注意事项、优点等四个方面,阐述了该教学法在生物课堂上的应用。  生物课堂四步十六字教学模式探究式教学在教学过程中,许多教师都会发现,现在的学生在课堂上的定力和专注程度越来越不理想。那种中国式专家报告的课堂,其效果越来越差。所以,新课改势在必行。教师要努力改变传统灌输式的教学模式,采用多样化的教学方法激发学生自主学习的主动性、积极性和创造性,让学生在活动过程中
随着城市化建设进程的不断推进,我国高速公路建设事业得到了跨越式发展。高速公路路线设计与环境保护问题,成为高速公路建设实现可持续发展的重要研究课题。论文就环境保护对
在电网基建输变电工程建设过程中,通常都存在办理征地、房屋拆迁以及林木青苗补偿的工作,此部分工作一般由业主委托属地公司或者施工单位进行,支付给农户或相关单位。“营改
本文利用超越对数函数和对我国中小银行1987~2004年间多元化经营行为的经济效应进行了实证分析,并从存量和流量角度探究了当前多元化经营的发展水平,提出了我国中小银行多元化
随着旅游消费方式的改变,休闲度假成为新的发展方向,温泉旅游作为休闲度假旅游产品正得到迅速发展。江西地热资源丰富,具有发展温泉旅游的优势,但也存在缺乏总体规划、产品层
<正>企业品牌是企业进入市场生存发展的标志,承载着企业信誉、经营实力、经营价值观等诸多内容,是企业与市场对接的桥梁。在当前建筑市场竞争异常激烈的环境下,建筑企业要想
为探讨刺槐对不同喀斯特环境的适应能力及其在生态系统构建的配置方式,通过室内水培实验,人工模拟干旱、高重碳酸盐、低营养、缺磷4种喀斯特土壤生境胁迫,研究刺槐幼苗的光合
小学德育实施全面科学的评价,是促进学生养成良好习惯的必然要求,是培养学生优良品质,促进学生健康成长的重要途径。要做到:从思想上树立科学、全面的育人观和质量观;坚持全