【摘 要】
:
数据的指数级增长给数据管理和分析带来了严峻的挑战.连接聚集查询是数据分析中一种常用运算,而MapReduce是一种用于大规模数据集并行处理的编程模型,研究基于MapReduce的连
【基金项目】
:
国家自然科学基金项目(61202088);辽宁省自然科学基金项目(200102059);中央高校基本科研业务费专项资金项目(N120817001)
论文部分内容阅读
数据的指数级增长给数据管理和分析带来了严峻的挑战.连接聚集查询是数据分析中一种常用运算,而MapReduce是一种用于大规模数据集并行处理的编程模型,研究基于MapReduce的连接聚集查询算法有着学术意义和应用价值.首先在归纳和扩展现有连接算法的基础上总结出4种基于MapReduce的连接聚集查询算法;接着根据应用场景的不同又提出另外两种实现算法;同时提出I/O代价是决定基于MapReduce的连接聚集查询算法性能的主要因素;最后通过大量实验分析这6种算法在不同查询应用下的优劣,总结了它们各自的适用场景
其他文献
在动态心电信号采集中,极化电压很容易使放大器饱和。传统的方法是采用高通滤波模拟电路来消除,但是输出往往会有残留。如果提升高通滤波截止频率,则会导致心电信号低频段失
同轴波导转换器在微波系统中具有重要的应用。基于网络级联及宽带匹配理论,对探针式同轴波导转换器结构进行建模,通过模式搜索法结合MATLAB编程计算出级联网络的S矩阵,使用空
本文用运用制度理论,从历史角度分析安徽省民营经济创新能力。安徽省民营经济依托于政治制度支持、地方政策优势,自身资源优势不断发展,但发展水平在中部地区仍然发展较为落
这是一个瞬息万变的信息时代,但任何变化都有一定的规律和特征。信息时代的变化规律和特征是什么?中外学者和业界众说纷纭,莫衷一是。本文从政治学、社会学的一个热门语汇"共
国际体育仲裁院仲裁裁决在法律上属于瑞士裁决,当事人只能向瑞士联邦最高法院申请撤销。根据瑞士联邦《国际私法法》的规定,申请撤销国际体育仲裁院仲裁裁决的理由仅限于仲裁
前庭系统疾病诸如急性单侧外周前庭病变、脑干及小脑病变等,常常涉及前庭受损后的代偿、再康复问题。既往研究表明,前庭受损后的代偿主要通过3种方式实现:修复(生化、细胞水
随着网络泡沫的破灭,越来越多的电子商务网站无法实现持续运营与发展。如何对电子商务网站进行评价,以提高服务质量与盈利能力日渐受到人们的重视与关注。众多研究者从不同角
<正>班组是铁路安全生产的前沿阵地,是安全文化的根基所在。班组安全文化使柔性化的人文管理与刚性化的制度管理相得益彰,有助于打造班组的聚合力,促进班组管理有序长效。近
目的:观察探讨低分子肝素和胰岛素降脂治疗对高脂血症急性重症胰腺炎患者预后的影响,总结临床应用价值。方法:选取高脂血症急性重症胰腺炎患者78例,按照随机数字表法分为胰岛
发展绿色经济需要提高税收制度的绿化程度。本文首先根据税种节能环保作用大小的不同,设立了测算税收制度绿化程度的计算公式,利用2001~2010年相关数据对中国税收制度的绿化