浅析Hadoop平台下的作业调度算法的研究

来源 :科学与财富 | 被引量 : 0次 | 上传用户:senfa88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:在互联网技术和计算机技术快速发展的背景下,云计算在数据挖掘等海量数据处理中起着重要作用。Hadoop是一个开源云计算平台,其核心是作业调度算法,通过作业调度算法的研究,可以提升大规模数据的处理能力。文章阐述了Hadoop平台和其作业调度算法,然后进行实验环境搭建,进而对Hadoop平台下作业调度算法进行研究。
  关键词:Hadoop;作业调度;集群
  前言
  随着互联网技术的迅猛发展,其面临的问题也日益突显,主要问题是用户的飞速增长,使得大规模数据处理成为难题。因此,需要借助Hadoop这个大数据处理工具。但是,在实际应用中,需要通过作业调度算法对Hadoop平台性能改进,减少资源的浪费,同时提升数据的处理能力。
  一、Hadoop平台概述
  云计算是由网格计算、分布式计算等发展而成的一种全新的商业计算模型。云计算技术由上至下可以划分为软件即服务、平台即服务、基础设施即服务三层[1]。而文章所研究的Hadoop属于平台即服务层,即云计算开源组织的分布式计算框架。Hadoop平台为应用程序提供了可靠的接口,节约了用户数据处理的成本,具有良好的可靠性、扩展性等优点。且在云环境下较为容易的搭建数据存储与数据分析平台,同时也助力了云环境数据处理技术的发展。
  二、作业调度算法
  作业调度目标是以满足用户作业需求为前提,提高系统的吞吐量,保障系统的负载均衡。目前,Hadoop平台主要的作业调度算法有FIFO调度算法、公平调度算法、计算能力调度算法三种,下面对这三种算法进行介绍。
  (1)FIFO算法
  FIFO(First In First Out,先进先出)调度算法是Hadoop平台中默认的算法[2]。FIFO调度算法在集群中,将接收到的用户作业提交到一个队列中,提交操作是按照作业优先级顺序或者是提交时间顺序进行。将数据初始化后,由TaskTracker为每一个节点进行任务的分配操作,分配的顺序一般是按照提交时间来进行的。节点任务在执行的过程中,任务是不能被剥夺的。FIFO算法的实现是JobQueueTask Scheduler,位于org.apache.mapred文件夹中。
  该算法的主要优点是实现简单、运行稳定,因为该算法针对的是单用户、单类型的作业调度。而在调度处理多用户多类型过程中,出现性能不稳、队列尾端作业饿死、资源浪费等问题。
  (2)公平调度算法
  公平调度算法是针对多用户多类型的作业进行调度的算法。公平调度算法中,在作业优先级一致的条件下,几乎均匀的将资源分配给各个作业节点。如果集群中仅有一个作业运行的情况下,该作业独自享有这个集群。当新的作业进入时,需要按照作业的优先级进行集群分享。简而言之,作业权重相同,作业分配的集群资源是相同的。
  该算法的主要优点是实现多用户的资源平均共享,提交时间较晚的作业不会饿死。但是该算法忽视了作业调度优先级问题。
  (3)计算调度算法
  计算调度算法功能与公平调度算法类似,但是在调度设计与实现中存在差异。该算法针对的是多用户作业队列,每个队列按照配置获取节点执行任务TaskTrack,然后按照配置的不同,對集群资源的百分比进行分配,这种算法能够对每个队列的资源予以限制。每个队列采用的是FIFO调度算法,队列内的调度是按照作业优先级进行的,而任务提交是系统随机进行分配的。
  该算法的设计思想是能够合理的分配计算资源在用户之间、队列之间的比例。但是,该调度算法简爱那个数据处理放置到最后进行考虑,就导致了作业的执行效率降低。
  三、实验及结果分析
  文章通过实验平台的搭建,对上述三种调度算法在执行中的不同进行对比。针对多个测试队列、多类型作业在不同作业调度算法下的性能,得出实验数据。
  1、实验环境搭建
  Hadoop实验环境的搭建,采用的是三台普通的服务器进行测试,三台服务器的主机名分别为f1、f2、f3,其IP地址分别为178.178.1.31、178.178.1.32、178.178.1.33。
  集群节点的硬件配置是,CPU 是4核,内存4GB,硬盘是320GB,;软件环境是Ubuntu-desktop操作系统,安装javajdkl和Hadoop软件,适用的开发工具是eclipse。其中,Hadoop软件安装的分别是1.0.4版本和2.2.0版本。
  2、实验实施
  实验的思路是,通过两个量级规模较小且相近的作业,和一个量级较大的作业进行比较,比较的是调度算法的运行时间和响应的情况。
  实验中测试文件是英文小说。在/Lerasort路径下生成三组作业原始数据,分别时10MB、15MB、1G。然后在Hadoop平台中运行,Teragen生成行大小是100B的数据。运行命令中参数的设置是根据生成数据的总量计算得出的。接下来在三台PC机中提交作业,且不同调度算法中的提交顺序相同。
  实验选择WordCount测试方式对作业执行,该方式主要是对文件中单词出现的次数进行获取。将参试文件转到HDFS中,然后进行调度算法的测试。
  3、结果分析
  使用FIFO调度算法对作业调度情况进行测试,按照顺序提交作业,作业运行的情况如表1所示。
  使用公平调度算法运行作业,运行的情况如表2所示。
  使用计算能力调度算法对每个作业运行,运行信息如表3所示。
  通过实验结果可以看出,公平调度算法的执行更为有效,因为其在提交作业时,就对资源进行分配。
  总结:
  为了对Hadoop平台下的作业调度算法进行研究,文章建立了小型的Hadoop集群,通过三种不同规模的作业,对三种调度算法进行了解。实验结果表明,公平调度算法较其他两种算法具有灵活、高效的优势。这一研究提高Hadoop平台的性能和资源利用效率都具有十分重要的实际意义。
  参考文献:
  [1]戴小平,张宜力.Hadoop平台下计算能力调度算法的改进与实现[J].计算机工程与应用,2015,51(19):61-65.
  [2]李千目,张晟骁,陆路,等.一种Hadoop平台下的调度算法及混合调度策略[J].计算机研究与发展,2013,50(s1):361-368.
其他文献
摘要:随着社会的发展,时代的变迁,我们国家民办高校教育的发展也是有目共睹的,民办高校的辅导员在思想教育也被我们国家越来越重视。民办高校的生源也越来越广泛。让我们的国家能够维持稳定的现状,然后继续发展,蒸蒸日上。民办高校的辅导员工作在教育业的最前线,是思想教育的引导者,是建设教育业的最强大的一支队伍。辅导员一直是严格要求自我,思想政治强、教育业务精、自我作风正、要求纪律严的标准自我约束。从我们国家的
期刊
摘要:在高校招生规模不断拓展的今天,大学生毕业数量呈现逐年上升趋势,在加快我国人才强国战略目标实现的同时,也面临了一定的就业困难问题,探究其中的深层次原因则是产业结构与人才结构的衔接不足。基于此,本文以产业结构、人才结构、大学生就业的概念界定为主要切入点,分析当前我国大学生的就业现状,阐述人才结构与产业结构之间的关系,重点探讨人才结构与产业结构有效对接的途径,旨在更好的缓解现阶段大学生就业难的现实
期刊
摘要:光环境设计教学管理及教学方法的改革采用体验式教学方法,提高了教学管理及学生知识掌握的效率和效果,学生作业学习管理提交系统建立是学校现代信息管理工作中的运用,信息化改革能够提高教学的质量和学生学习的兴趣、使教学管理走向科学化、信息化、规范化。学生作业的无纸化管理节省纸质资源,提高环保意识,绿色办公和绿色学习,软件程序网络发挥使得课程共享资源的建立,利用网络共同提高高职特色教育,提高国家职业教师
期刊
摘要:记录校园生活的点点滴滴,引导正确的价值观是高校共青团组织的工作重点。伴随新媒体的迅猛发展,渗透到人类社会的政治、经济、思想、文化等众多领域,不仅改变了社会的传播形态,也影响着人们的生活方式及思维方式。这使得大学生群体获取信息和发表观点的渠道增多,但也更容易受到各种信息来源的影响。因此,基于社会化媒体平台的大背景,为了更好地对高校学生进行思想引领、把握实时动态文章选取了高校新媒体平台运营较为出
期刊
摘要:当前,会计已经成为了社会当中非常常见、非常重要的一种职业,其与国家经济的健康、稳定发展紧紧相关。和其他很多职业一样,会计也有着许多的职业道德要求,其中最基础、最重要且永久不变的一个职业道德要求是不做假账,实事求是、诚信廉洁,保持高度的社会责任感、职业责任感,作为会计从业人员,只有做到了这一点,才能保障国家经济安全、促进国家经济的发展和自身的职业发展。本文基于作者自身的实际工作与学习经验,首先
期刊
摘要:随着科学技术的不断发展,教学在形式上发生了重大变革,国家在教学整体效率上得到了明显的提升。本文将对智能手机APP在教育教学领域应用所产生的影响进行详细分析,并对其在教育教学中应用的主要优势进行阐述,针对APP在未来教育教学中应用的形式提出有效的建议,从而推动我国教育事业的可持续发展。  关键词:智能手机;APP;教育教学领域;应用  智能手机APP的产生和发展对社会诸多行业产生了重要影响,在
期刊
摘要:藏开发后期的地层压力低,油层供液能力差,吞吐轮次高,注汽效果差,吞吐油汽比趋近经济极限,采出程度已高达35.6%,产量形势非常严峻,油藏开发需要越来越精细,因此需要对原始测井解释结果进行修正,重新进行二次解释,为后期区块挖潜提供理论支持。  关键词:稠油;开发后期  1.概述  锦92块位于辽河断陷盆地西部凹陷西斜坡的西南部,开发井数多,经历多次开发调整,时间跨度大,同时,地层压力亏空及层间
期刊
摘要:大一新生的特点决定了新生辅导员的工作是纷繁和复杂的,这更需要我们的新生辅导员以对党的教育事业负责的态度和对学生满腔的热爱,以自己的真心、热心、耐心和细心投入新生的思想政治工作,全方位关心其思想、学习和生活,切实履行自己的岗位职责。  关键词:新生辅导员;工作对策  高校辅导员是高校学生工作最基层的组织管理者和协调者,既是教与学双向交流的信息员,又是学生学习生活的服务员。而新生辅导员面对的是刚
期刊
大学生心理健康教育是思想政治教育的重要组成部分,是一项专业性较强的助人工作。高校辅导员作为大学生思想政治教育的主力军,如何更好地开展大学生心理健康教育是深入贯彻党和政府关心关怀大学生心理健康的政策的重要举措,是对于大学生日益增长的心理健康教育需求与高校心理健康教育现实矛盾的切实回应,是大学生心理健康教育实践日益精细化、科学化的表现。为此,本文就高校辅导员开展大学生心理健康教育的成效进行分析研究。 
期刊
摘要:中职院校学生在校期间有设备操作实习,我发现学生在实训过程中常出现学习不积极、实训工作态度差等现象。因此建议开展以技能竞赛为依托,以赛促学,构建“教、学、做”一体化任务驱动型技能教学模式,使学生从理论到实践全面掌握综合技能,最终完成实习训练任务。  关键词:技能竞赛;任务驱动;模具综合实训  一、现状分析  经调查,湖南地区大部分院校开展的模具实训内容主要包括钳工、普车、普铣、线切割等内容,大
期刊