网络负载感知的Spark两段式流水线任务调度模型研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:papaya007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,数据爆炸式增长,为了应对数据处理的挑战,以“计算跟随数据移动”为特征的新型海量数据处理平台应运而生,如Spark。Spark是大数据时代非常流行的一种并行处理框架,而任务调度对Spark集群的性能影响是非常大的。尽管任务调度被认为是一个NP-完全问题,仍有大量学者提出了很多启发式规则去获取该问题的近似最优解。但是他们大部分都忽视了任务执行过程中的资源需求的动态性。这就存在资源的不完全和不均衡使用情况,从而导致集群性能低下。考虑到任务的整个生命周期,数据传输期间的CPU利用率通常较低。特别是对于大多数分布式数据处理平台,数据传输非常耗时,通常会导致总体CPU使用率较低。同样,任务计算期间的网络吞吐量也很低。从此特性出发,本文提出了一种基于网络负载变化感知的启发式任务调度算法,并在此基础上从动态资源需求的角度实现了两阶段流水线任务调度器D2PTS(Dual-phase pipeline task scheduler),旨在最大程度地提高集群资源的利用率,作为Spark现有调度机制的补充。详细来看,本文的主要贡献包括:1)D2PTS根据任务的网络负载状态将执行过程分为两个阶段:网络密集(需要网络资源)和网络空闲(不需要网络资源)。为了提高整体资源利用率,本文提出了不同的算法来分别评估任务在网络密集阶段和网络空闲阶段的执行时间。2)本文实现了一种两阶段流水线任务调度器。当正在执行的任务处于网络空闲阶段时,D2PTS可以在适当的时间额外调度新的处于网络密集阶段任务进行执行。在此调度策略下,共享同一CPU核心的两个任务以粗粒度流水线模式执行。这种执行方法可以更早地启动任务并改善资源使用的不均衡性。3)最后,在开源平台Spark 2.4.3上实现了D2PTS模型原型,基于性能测试平台Hi Bench,选取了多种类型的负载对本文实现的任务调度模型进行实验性能分析。实验结果表明,与Spark默认调度策略相比,D2PTS不仅可以减少应用程序的执行时间(平均缩短10%),还可以提高资源利用率。
其他文献
随着全面二孩生育政策实施时间的推进,我国生育率有了一定程度的提升,导致相同职工的生育保险待遇享受次数也有所增加,同时产假延长导致生育津贴随之增多,这些变化一起推动了生育保险基金支出的增加。在这样的变化中,为保障公民的基本福利,促进社会和谐,增强社会保险基金的共济能力,生育保险与职工基本医疗保险在2019年年底之前实现全面合并,合并之后很多学者发表观点认为该项政策促进了生育保险保障范围的扩大,但没有
相变材料具有蓄放热过程中温度恒定且相变潜热量大的特点,将其封装后应用于生活水箱中可实现太阳能的错时用能,从而有效缓解太阳能热水系统热水供应和用户需求之间不匹配问题。然而,当前在生活水箱中常用的石蜡和有机酸等相变材料较低的导热系数限制了其在水箱中的蓄热性能和实际应用效果。现有解决方法,如往封装结构中添加翅片和石墨等,会导致封装结构蓄能密度的降低,且石墨等高导热剂会在蓄能过程中发生沉降。针对此,本文提
在信息化高速发展的今天,全球通信需求急剧增加,使得目前能提供全球数据连接和实时语音传输的卫星移动通信成为研究的一大热点。但是随着通信环境的日益恶化,卫星也面临着复杂多变的电磁环境以及各种不同类型干扰的影响,这些都在不同程度影响着通信的质量和可靠性。本文主要采用信号处理的方法,提出了卫星移动通信系统中的干扰检测与识别方案,实现卫星移动通信系统中的干扰检测和识别功能。本文主要针对以下几个方面进行研究:
随着全球制造产业和材料科学的迅猛发展,复合材料由于其优秀的性能表现被广泛应用于在航空航天、民用器材等领域,实现复合材料各类损伤缺陷快速有效地检测成为一个尤为重要的问题。本文在目前常用大功率超声红外热成像缺陷检测系统的基础上,搭建了一套低功率的超声红外热成像缺陷检测系统。系统优化了常用大功率超声红外热成像检测系统体积大、质量重、难以与热像仪联动等缺点,之后使用搭建的系统对复合材料中平底孔缺陷、涂层体
随着全球人口老龄化,癌症已成为严重威胁人类健康的疾病之一。常见的癌症治疗方法如化疗、放疗和手术等存在治疗效果欠佳、副作用较大等问题。多种方式的联合治疗与疗效的即时反馈对提高肿瘤的治疗效果具有重要作用。目前通过纳米技术研制的纳米药物已经成功应用于癌症的诊断与治疗,但是通过成像来评估肿瘤治疗效果的报道并不多见。因此,为了实现纳米材料在肿瘤处的多模成像、联合治疗以及通过成像监测治疗效果的目的,我们开展了
烯基醚/烯基硫醚是一类重要的有机化合物,常被用作有机合成中间体来构建各种天然产物分子和生物活性分子。一直以来,合成烯基醚/烯基硫醚的工作都是一个热门的研究方向,得到了大量有机合成工作者的关注,取得了长足的进步。在已报道合成这一大类化合物的方法中,绝大多数方法采用了贵重金属催化剂,比如金、银、铑和钯(Au,Ag,Rh,Pd)等。目前,通过贵金属催化的方法合成了大量的烯基醚/烯基硫醚化合物,但是依赖使
线性方程组的求解问题是数值代数领域中研究和讨论的一个重要课题.由于很多实际问题都可以转化为线性方程组的求解问题,这使得求解线性方程组的新方法层出不穷.现有的大部分求解方法都是利用线性方程组的系数矩阵的列信息或整个系数矩阵的信息通过直接或迭代的方式来求解线性方程组.Kaczmarz独辟蹊径,提出了行迭代的Kaczmarz方法.该方法每次迭代仅利用线性方程组的一个方程的信息,极大地减少了运算量.但是该
反腐败斗争是我国一直在持续展开的工作,从2014年开始更是进一步加强了其力度,被我们熟知的由国家公安部实施的“猎狐”以及“天网2019”系列等反腐败行动,通过对各类在逃的红通名单的公示,使得跨境跨区域追赃追逃工作成为重中之重。据统计我国目前在国外的贪腐人员超过10000人,这些人携走的违法所得大概是8000亿人民币左右,赃款的数额十分巨大。解决跨区域跨境洗钱犯罪是一个十分艰辛且又刻不容缓的问题,这
中草药作为一种特殊的防病、诊疗商品,不仅关系到中医药事业的发展,而且关系到我们的健康和民生安全。然而,在目前的市场环境下,中草药由于存在着一些非法经营、加工、掺假等问题,质量难以得到保证,使得中药企业诚信受到社会各界的严重质疑。为了保证中草药的质量,必须了解清楚影响其质量的因素,并提出新的监管解决方案。由于区块链技术具有不可篡改、附带时间戳等技术特点,可以保证溯源系统按时间顺序安全可靠地记录数据;
随着风电的快速发展及大规模集中接入,因电网电压突变和频率异常造成风机脱网事故频繁发生,使电网面临严峻的稳定性问题。因此,研究风电机组的电压穿越控制与频率响应控制对于提升风电机组并网稳定运行能力具有重要的理论和实际意义。同时,为研究风电场域层面并网后的安全稳定运行,有必要对风电场的等值建模展开研究以提供模型基础。基于以上背景,本文从电压穿越控制、频率响应控制和风电场的动态等值建模等方面对双馈风电机组