基于hadoop的任务资源分配与控制

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:owennb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop是一个开发和运行处理大规模数据的软件平台,是Apache的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。Hadoop框架中最核心设计就是:HDFS和MapReduce。HDFS提供了海量数据的存储,MapReduce提供了对数据的计算。Hadoop作为云计算的一种解决方案也越来越受到人们的重视。Hadoop资源调度器的为需要计算机资源的任务分配资源,使他们能够顺利完成计算任务。好的资源调度可以充分利用资源,规避任务运行中的问题,提高计算机资源利用率。因此如何做好hadoop的任务资源分配与控制具有重要的意义。本文在广泛研究调度算法的基础上,利用作业执行的历史数据来指导hadoop的任务资源分配与控制。本文首先介绍了一个信息采集系统。信息采集系统能够采集、传输、保存计算节点的实时信息,map任务和reduce任务的执行信息,job执行信息。我们将采集的信息来保存在数据库中供后面调度使用。在广泛细致的研究公平调度的基础上,发现了公平调度的两个能够改进的地方。首先,每个任务的内存需求不同。程序运行都是需要一定的内存支持的,如果一个任务需要相当大的内存,但是被分配到执行任务的计算节点不能够提供足够的内存,使导致任务不能够正常的执行。那么这个任务会在该计算节点上执行相当缓慢,影响其他任务的执行。其次,公平调度算法是通过任务的个数来保证节点的负载均衡。但是由于每个任务都有自己的特点,占用的资源不同、作业的类型不同。这样分配不能达到很好的负载均衡。本文提出利用监控控的历史数据估算即将调度的作业的内存和当前节点内存状况,预计作业是否能够顺利完成,从而进行接纳控制。通过分析任务队列中作业类型和节点上任务的类型,从作业队列中选择最优的任务,达到负载均衡。
其他文献
本论文研究内容源自科研课题“短波综合模拟设备的研制”,目的是设计一种能够在室内对短波自动选频系统进行测试的设备。短波综合模拟设备主要分为两个部分:短波综合模拟设备
移动通信基站数量、终端数量以及数据业务量的高速增长,使得能源和无线电频谱成为未来移动通信日益稀缺的资源。因此,迫切需要通过整合通信技术与能源技术现有的研究成果,实
随着信息时代的快速发展,内容管理已经成为所有web应用的基础,从电子政府、企业信息化、综合性网站到垂直门户、数字图书馆乃至所以的电子商务,必定会涉及到内容的采集、创建
目的:探讨能谱CT瞬时双能成像技术分析体内泌尿结石成分的准确性,综合血清电解质、尿PH值和尿比重(Specific gravity,SG)情况,指导结石治疗。方法:选取我院术前经B超或X线诊断为泌尿系结石的106例病人为结石组,术前用能谱CT行泌尿系扫描,使用有效原子序数结合直方图鉴定结石成分,术后使用红外光谱法分析结石成分作为金标准,分析两种方法的一致性。以同期住院的109位非结石患者为对照组,
自2009年教育部颁布《关于做好全日制硕士专业学位研究生培养工作的若干意见(教研[2009]1号)》(以下文中简称《意见》)以来,我国全日制工程硕士研究生教育进入快速发展阶段。
新一代移动通信网络C-RAN是基于集中化处理、协作式无线电和实时云计算的无线接入网架构。该架构将基带处理资源进行集中,形成一个基带资源池,并对其进行统一的管理和动态分
近年来,随着我国的全日制工程硕士教育进入了快速发展阶段,我国多所院校开展了全日制工程硕士研究生教育培养模式试点改革,其中之一就是建立了校外导师聘用制度。良好的校外
目的骨巨细胞瘤作为亚洲人群多发的一种骨肿瘤,其对骨组织破坏能力强、致侵袭能力强、易复发、残率高且具有一定的转移性,寻找其骨侵蚀破坏的机制及新的治疗靶点成为该肿瘤的研究重点。目前关于骨巨细胞瘤的研究多为临床方面对术式的探索或病例回顾性研究,基础研究方面也多集中于破骨细胞的RNAK信号通路等,因此本研究将重点关注于剖析骨巨细胞瘤肿瘤组织细胞构成以实现对组织内细胞间异质性的分析,结合基因测序技术实现对肿
针对新疆等西北干旱地区夏季和秋季气候特点,模拟混凝土施工现场常见养护方式,对不同水胶比、不同粉煤灰掺量条件下的混凝土3d、7d、14d和28d抗压强度进行检测,分析不同养护
在移动通信网络中,D2D(Device-to-Device)通信代表的是一种新的通信范式,它能促进地理空间位置相近的移动设备间更方便地进行数据信息交换。对于当今紧张而又有限的频谱资源,