异构环境下增强自适应能力的MapReduce调度算法研究

来源 :河南理工大学 | 被引量 : 0次 | 上传用户:a3470114
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce是一个编程模型,也是一个算法模型,用于处理和生成的超大数据集的相关实现。Hadoop是MapReduce的开源实现,它不仅广泛应用于批量大作业,同时也用在处理相对低效率的短作业。然而,现有的Hadoop都是建立在虚拟的同构集群下,并使用假设条件来决定落后队列中的任务何时推测式执行,但是这种虚拟的同构在实践中却是不可行的。  目前我们要解决的问题是如何高效地运行推测执行机制使系统性能最大化。本文主要研究了Hadoop默认的调度器和异构环境下LATE调度器和H-LATE调度器推测执行机制的不足。在 H-LATE调度算法的基础上提出了一个增强自适应能力的KSAMR调度算法,来提高MapReduce中落后任务的重执行。为了更准确得识别慢任务,该算法记录了每个节点的历史信息,采用机器学习技术 K-means聚类算法将记录节点阶段进度值的历史信息划分为K个聚蔟,动态地调节阶段进度值参数,平衡节点上的负载,准确地查找慢任务。并将节点进一步分类,从而能够在快速节点上启动落后任务的备份任务,从而减小响应时间,并尽量避免节点空载,以免浪费系统资源。  为了验证该算法的性能,本文搭建了Hadoop集群,并在该集群上实现KSAMR调度算法。通过大量的试验数据,对影响系统性能参数进行合理的配置。最后通过三个指标:任务阶段进度值鉴别能力、剩余时间鉴别能力、慢任务鉴别能力验证增强自适应的MapReduce调度算法的有效性。试验结果表明KSAMR调度算法通过准确估计任务的执行时间并启动备份任务显著地提高了MapReduce调度算法的性能。
其他文献
随着网络的重要性和功能日益扩大和加强,网络的规模和应用得到不断发展,网络结构变得越来越复杂和多样化。这对网络管理提出了更高的要求。传统的网络管理系统大多是集中式的,其
高精度高稳定度的卫星姿态控制系统作为现代小卫星的关键技术,业已受到国内外的广泛关注,它也是实现卫星所担负的各种探测、开发和空间任务的重要保证。本文针对对地观测小卫星
无线传感器网络(Wireless sensor networks,WSN)技术作为一种新型的、智能的信息获取、信息处理和信息传输技术,因其自组织、可维护、无人看守、抗毁性强等特点被广泛应用于智
随着嵌入式系统和网络的日益结合,在嵌入式实时操作系统中引入TCP/IP协议栈,以支持嵌入式设备接入网络,成为嵌入式领域重要的研究方向。在网络服务环境下,实时嵌入式操作系统
随着计算机网络和多媒体技术的迅猛发展,Internet上的Web应用一直呈爆炸式的增长,其中绝大部分是HTTP请求服务。由于HTTP请求的增长的过快,导致许多的网站的Web服务器面临超
神经网络集成技术是神经计算技术的一个研究热点,在许多领域已经有了成熟的应用。神经网络集成是一项相当成功的技术,它用有限个神经网络对同一个问题进行学习,集成在某输入
开放计算环境中用户之间的安全通信存在着安全分析主体多样化、安全信息收集困难、安全度量相对化和安全需求比较复杂等特点,信任管理模型方面的研究为解决这些问题提供了思路
近年来,随着科学技术的不断发展,测试工作在各种现代化装备系统的设计、制造和验证过程中的地位变得越来越重要。而在一个自动测试系统中,测试程序集(TPS)及其开发与运行环境又
随着矿山信息化技术的快速发展,信息系统的种类和数量日益增多,但其服务对象主要限于管理人员,落后的信息管理模式使得绝大多数一线矿工难以获得及时的信息服务,无法有效预防各类
本文以集成供应链管理(ISCM)软件开发项目为背景,重点研究两个方面内容:层次分析法(AHP)在供应商选择过程中的应用;供应商管理软件的构架与构件模型的研究与实现。 首先给出