基于Hadoop集群的作业调度算法的研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:caciquer1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的高速发展,我们已经进入大数据时代,几乎所有的事物都与数据有关。如今,各种应用会使每个月都产生 TB级别甚至 PB级别的数据,与此同时,越来越多的需求使每天需要处理几 PB、几百 PB甚至 EB级的数据。Apache开发的云计算平台 Hadoop是基于 Google的云平台的开源实现。Hadoop平台屏蔽了系统分布式处理的细节,通过使用MapReduce编程框架,开发人员只需关注业务的实现过程,而分布式的处理过程由 Hadoop底层自动完成;Hadoop可以大大节省企业 IT设施成本,因为它可以在普通 PC组成的集群上获得良好的运行效果;同时,开源的 Hadoop使中小型企业以及个人开发者拥有分布式计算的能力。虽然得到了广泛的支持,开源的 Hadoop仍是一个不断发展中的平台,在实际应用中,还存在着很多问题。  本文首先对 Hadoop平台的产生背景进行介绍,然后深入的研究了 Hadoop平台的框架:Hadoop分布式文件系统(HDFS)和MapReduce并行编程框架,对 Hadoop平台的作业调度算法进行深入研究,针对特定作业、特定环境下,存在的相关问题,对调度算法进行了改进,具体工作如下:  (1)通过研究公平调度算法的处理过程,发现在处理大量非本地任务时,易产生热点问题,提出一种基于热点预测的公平调度算法。该算法对潜在热点进行预测,避免产生实际热点,从而提高了对不同作业的处理效率。  (2)考虑到用户对作业处理的时间要求,提出一种基于截止时间限制的动态调度算法(DCDS)。该算法实时监控作业运行状况,并对作业运行时间进行动态估算,从而确定作业优先级;对于时间紧迫的作业,我们引入了抢占策略,经试验测试该算法提高了系统资源的利用率和吞吐量。
其他文献
随着数字视频技术的发展,图像和视频编码技术逐渐发展成为专门的学科领域——图像压缩编码。图像编码的核心技术之一是对图像数据实施变换。自从1974年印度科学家提出离散余
气候环境与人类的生存与发展息息相关,古气候环境学作为气候科学的重要分支为研究当今以及未来的气候变化提供科学依据。古气候环境科技资源数量巨大,且各研究机构采用的数据
网格(Grid)作为继Internet和Web之后的第三次信息技术浪潮在全球范围内获得了广泛的关注。随着网格技术的发展和应用,网格已逐步渗透到企业中使用。在面向服务的企业网格中,
随着人们需求的提升和多媒体技术的进步,电影产业逐步向数字化方向迈进。而传统的JPEG等压缩技术无法满足数字电影的要求。在这种背景下,新一代静止图象压缩标准JPEG2000便应
广电数字化时代的来临给广电运营商运营支撑和管理工作带来了极大的挑战。当前还处于模拟电视时代的运营支撑基础信息模型简单粗放,随着产品的丰富和客户对服务质量要求的提
入侵检测系统已经能够用各种检测方法来检测入侵,但是,大多数的入侵响应系统只是形成日志或报警来通知系统管理员,滞后的人工响应造成了不可恢复的严重损失。入侵检测系统迫
本文首先介绍了视频会议系统的一些基本知识,包括分类、组成、发展现状等,对ITU-TH.323多点视频会议系统及相关模块的设计和实现进行了探讨。其次优化了OpenH323协议栈,在Linux
随着互联网基础设施性能的不断提高和技术的发展,人们不再满足于从互联网上浏览以文本和图片构成的信息,而是更加青睐于高清晰度、高质量的互动多媒体信息。而多媒体信息需要占
面对竞争日益激烈,需求不断变化的国际市场,企业只有不断地缩短产品开发时间、提高质量、降低成本、改进服务,才能在激烈的市场竞争中立于不败之地。使用传统的协同设计开发模式
人脸检测技术作为计算机图像处理和人工智能技术的一个重要分支,在模式识别、信息安全、人机交互、智能监控以及视频检索等领域有着广泛的应用前景,受到了研究学者和工程开发人