MapReduce中同类机排序极小优化最大完工时间问题

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户：hbshwydd

【摘要】

：

MapReduce是一种流行的批处理框架,用于大规模数据集的并行运算,其主要作用是分布式集群节点分析、保持数据局部原则、使数据更加真实有效. 本文主要研究h台同类机, reduce任

【作者】

：

刘文娟

【机构】

：

曲阜师范大学

【出处】

：

曲阜师范大学

【发表日期】

：

2018年期

【关键词】

：

MapReduce 在线排序排序问题可中断不可中断最大完工时间

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

MapReduce是一种流行的批处理框架,用于大规模数据集的并行运算,其主要作用是分布式集群节点分析、保持数据局部原则、使数据更加真实有效. 本文主要研究h台同类机, reduce任务可中断和不可中断的MapReduce在线排序模型, 目标函数是极小化工件的最大完工时间. 本文结构安排如下:　　第一章主要介绍排序问题的基本知识、MapReduce的基本概念.　　第二章主要研究h台同类机reduce任务可中断的在线MapReduce排序问题,工件以over list释放. 目标函数是极小化工件的最大完工时间. 在MapReduce排序模型中有两个假设:一是MapReduce排序的map任务可以并行加工, 而reduce任务不可并行加工. 二是必须得等一个工件中的map任务加工完成之后才可以加工reduce任务. 本章仍沿用这种假设, 即假设map任务可以无限分割, 即可并行加工, 而reduce任务不可并行加工, 但在本章中, 工件的reduce任务可以中断, 该模型假设为只有当map任务完成之后才可以知道reduce任务的信息,所以在本章中设计的算法为工件到达之后先将所有map任务分到h台机器上,使得加工完map任务的h台机器的完工时间相等, 对于reduce任务可中断的情况, 我们采用了文[26]提出的McNaughtons around rule这一方法,该方法得到的机器的完工时间为Cmax=max{max K=1,2,……,h Tk/Bk,Tn/Bh}, 本章利用该方法设计了一个近似算法, 给出了近似算法的竞争比的上界为2?∑k0j=1sj/∑hj=1sj,其中s1≥s2≥…≥sh,其sj及其j的加工速度,k0为使得Tk/Bk(1≤k≤h)达到最大值的机器的编号, h是机器台数, 其中Tk=|r1|+|r2|+…+|rk|,Bk=s1+s2+…+sk,|r1|≥|r2|≥…≥|rm|,|ri|是第i长reduce任务的长度.　　第三章同样研究了?台同类机在线的MapReduce在线排序问题,与第二章不同的是: 本章研究了reduce任务不可中断的情况,工件以over list释放,目标为极小化工件的最大完工时间,同样假设一个工件的map任务完成之后才可以知道该工件reduce任务的信息,本章所采用的算法思想是: 对于到达的工件将map任务放在?台机器上加工, 使得加工完map任务的机器完工时间均相等,然后将reduce任务以LPT规则排序,依据经典排序的LPT规则,设计了近似算法,并得到了该近似算法的竞争比的上界.　　第四章是总结了全文主要内容,并对接下来的努力方向提供了参考.

其他文献

SMS4结构分组密码的线性活动轮函数极小个数分析

SMS4结构分组密码是我国官方2006年首次发布的商用分组密码标准,其安全性与其线性活动轮函数极小个数和轮数有着密切的联系,但是,关于SMS4结构分组密码的线性活动轮函数极小

学位

分组密码SMS4结构线性传播轨迹活动轮函数个数

强C∗-正规子群与有限群结构

本文主要通过观察c*-正规子群，引入强c*-正规子群以及强C*N-群的概念，研究有限群的可解性、p_可解性、p_超可解性以及p_幂零性等.　　第一章，介绍了引入新概念的缘由，同时给出了

学位

正规子群有限群结构极大子群共轭类图

基于支持向量机的土壤基础肥力评价和土壤有机质含量预测研究

耕地土壤质量与肥力受到越来越多的关注,土壤有机质(Soil Organic Matter,SOM)作为土壤重要的养分来源之一,也成为研究的热点。土壤有机质含量预测是根据长期定位实验点的土

学位

支持向量机等级分类土壤有机质土壤基础肥力

黄芪多糖联合顺铂治疗卵巢癌相关恶性腹水的疗效及对耐药基因的影响

目的:探讨黄芪多糖联合顺铂治疗卵巢癌相关恶性腹水的疗效及对耐药基因的影响。方法:选择2015年1月至2018年12月山东省广饶县中医院诊治的卵巢癌相关恶性腹水患者120例，根据患

期刊

卵巢肿瘤腹水黄芪多糖耐药基因

混合多重图的边着色

近年来，超图理论得到迅速发展和完善。超图是有限集合的子集系统，是离散数学中最一般的结构，超图的着色理论在离散数学中起着非常重要的作用。　　为了很好的解决能源供应、工

学位

混合多重图混合图上色数下色数可行集

消防员问题图的存活率研究

消防员问题(Firefighter Problem)是由著名计算机理论学家Hartnell在第25届组合数学与计算大会上提出的.设G是一个有n个顶点的连通图，k是正整数.假设火在图G的某一点v处燃起，消

学位

消防员问题图论存活率动态传播模型

一类具有松弛项的粘双曲系统的全局解

守恒律方程为五十年代新起的一个研究领域，此类型方程所涵盖的物理模型十分广泛，几乎所有连续力学的模型方程均属于这种形式．对于2×2非线性双曲型方程组解的存在性和双曲守

学位

守恒律方程物理模型连续力学粘双曲系统全局解人工粘性消失法补偿列紧

MapReduce中同类机排序极小优化最大完工时间问题

与本文相关的学术论文