MapReduce中同类机排序极小优化最大完工时间问题

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:hbshwydd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce是一种流行的批处理框架,用于大规模数据集的并行运算,其主要作用是分布式集群节点分析、保持数据局部原则、使数据更加真实有效. 本文主要研究h台同类机, reduce任务可中断和不可中断的MapReduce在线排序模型, 目标函数是极小化工件的最大完工时间. 本文结构安排如下:  第一章主要介绍排序问题的基本知识、MapReduce的基本概念.  第二章主要研究h台同类机reduce任务可中断的在线MapReduce排序问题,工件以over list释放. 目标函数是极小化工件的最大完工时间. 在MapReduce排序模型中有两个假设:一是MapReduce排序的map任务可以并行加工, 而reduce任务不可并行加工. 二是必须得等一个工件中的map任务加工完成之后才可以加工reduce任务. 本章仍沿用这种假设, 即假设map任务可以无限分割, 即可并行加工, 而reduce任务不可并行加工, 但在本章中, 工件的reduce任务可以中断, 该模型假设为只有当map任务完成之后才可以知道reduce任务的信息,所以在本章中设计的算法为工件到达之后先将所有map任务分到h台机器上,使得加工完map任务的h台机器的完工时间相等, 对于reduce任务可中断的情况, 我们采用了文[26]提出的McNaughtons around rule这一方法,该方法得到的机器的完工时间为Cmax=max{max K=1,2,……,h Tk/Bk,Tn/Bh}, 本章利用该方法设计了一个近似算法, 给出了近似算法的竞争比的上界为2?∑k0j=1sj/∑hj=1sj,其中s1≥s2≥…≥sh,其sj及其j的加工速度,k0为使得Tk/Bk(1≤k≤h)达到最大值的机器的编号, h是机器台数, 其中Tk=|r1|+|r2|+…+|rk|,Bk=s1+s2+…+sk,|r1|≥|r2|≥…≥|rm|,|ri|是第i长reduce任务的长度.  第三章同样研究了?台同类机在线的MapReduce在线排序问题,与第二章不同的是: 本章研究了reduce任务不可中断的情况,工件以over list释放,目标为极小化工件的最大完工时间,同样假设一个工件的map任务完成之后才可以知道该工件reduce任务的信息,本章所采用的算法思想是: 对于到达的工件将map任务放在?台机器上加工, 使得加工完map任务的机器完工时间均相等,然后将reduce任务以LPT规则排序,依据经典排序的LPT规则,设计了近似算法,并得到了该近似算法的竞争比的上界.  第四章是总结了全文主要内容,并对接下来的努力方向提供了参考.
其他文献
SMS4结构分组密码是我国官方2006年首次发布的商用分组密码标准,其安全性与其线性活动轮函数极小个数和轮数有着密切的联系,但是,关于SMS4结构分组密码的线性活动轮函数极小
本文主要通过观察c*-正规子群,引入强c*-正规子群以及强C*N-群的概念,研究有限群的可解性、p_可解性、p_超可解性以及p_幂零性等.  第一章,介绍了引入新概念的缘由,同时给出了
耕地土壤质量与肥力受到越来越多的关注,土壤有机质(Soil Organic Matter,SOM)作为土壤重要的养分来源之一,也成为研究的热点。土壤有机质含量预测是根据长期定位实验点的土
目的:探讨黄芪多糖联合顺铂治疗卵巢癌相关恶性腹水的疗效及对耐药基因的影响。方法:选择2015年1月至2018年12月山东省广饶县中医院诊治的卵巢癌相关恶性腹水患者120例,根据患
1999年9月20日~9月21日,由中国有色金属工业贸易集团公司、中国有色金属工业再生资源公司与新华财经信息咨询有限公司共同主办的第一届中国金属再生资源国际研讨会在杭州召开。来自国内外
1941年6月3日,陕甘宁边区政府在举行县长联席会议,讨论边区民生、财政、建设工作。这个会议是从6月1日开始的,计划4日结束。3日下午5时许,室内的同志正在听取边区政府主席林
近年来,超图理论得到迅速发展和完善。超图是有限集合的子集系统,是离散数学中最一般的结构,超图的着色理论在离散数学中起着非常重要的作用。   为了很好的解决能源供应、工
毛泽东思想作为马克思列宁主义普遍原理和中国革命具体实践相结合的产物,有一个形成和发展的过程。与这个思想理论的发展和成熟过程相适应,毛泽东思想作为一个科学概念的提出
消防员问题(Firefighter Problem)是由著名计算机理论学家Hartnell在第25届组合数学与计算大会上提出的.设G是一个有n个顶点的连通图,k是正整数.假设火在图G的某一点v处燃起,消
守恒律方程为五十年代新起的一个研究领域,此类型方程所涵盖的物理模型十分广泛,几乎所有连续力学的模型方程均属于这种形式. 对于2×2非线性双曲型方程组解的存在性和双曲守