基于DVFS的节能调度策略在Spark on YARN中的研究与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:Melanzpl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息的爆炸式增长推动互联网进入了大数据时代,随着大规模数据计算需求的增加和云计算集群的规模急剧扩张,大数据计算平台的能耗问题变得日益突出,过高的能耗所带来的电能损失不仅为云服务商增加了资金成本,同时也对环境带来了不可逆的损害。如何保证云服务提供商在满足用户服务等级协议(SLA)的前提下,尽可能的降低能耗,成为了大数据计算平台能耗研究亟待解决的问题。Hadoop1.0在可扩展性、计算效率和资源利用率方面存在诸多不足,Hadoop2.0将资源管理功能抽象为YARN资源调度框架。Spark内存计算框架基于Hadoop生态体系,很好的弥补MapReduce在计算性能以及高级数据分析处理方面的不足。Spark on YARN架构越来越多的被云服务提供商在数据中心广泛应用,本文从实际出发,针对Spark on YARN原生调度算法在能耗方面的不足,结合动态电压频率调整技术(DVFS)技术进行节能优化,主要的研究工作如下:1.本文设计并实现了基于DVFS的节能调度系统,并构建了基于频率的CPU能耗模型。在原生Spark on YARN的基础架构上进行优化,通过状态监控模块对应用程序运行过程中的状态信息进行监控获取,通过能耗评估模块对应用程序能耗进行定量分析,通过频率调整模块利用DVFS技术动态调整CPU频率。为之后的研究提供了平台支持。2.提出了一种基于DVFS频率感知的YARN层节能策略,针对应用程序的多样性,本文选取了三种基准应用程序,测试了其在不同频率下的计算性能以及能耗表现,为每种应用类型定位在满足其SLA标准下的最低能耗频率,对于未知目标应用程序,通过K-Means算法对其与基准应用程序进行聚类,定位其最相似的基准应用程序,通过DVFS技术对处理器频率进行预处理,在保证计算效率的前提下,达到节能的效果。3.针对数据规模较大时数据倾斜导致的YARN层节能策略计算效率下降等问题,对Spark层调度算法进行优化,提出了一种基于DVFS的双层频率感知节能策略。结合Shuffle机制的特点,利用DVFS技术动态调整Stage生命周期内各个Task所部署节点的CPU频率,减少节点空闲时间,降低能耗,提高Task完成时间均衡度。同时利用DAG图计算不同Stage的权重,对于权重值较高的Stage分配性能较优的计算节点,在保证SLA的前提下,减少各个节点空闲作业时间,进一步提高节能效果。
其他文献
生物质能源是一种低污染的可再生能源,由于其在燃烧过程中对大气的二氧化碳净排放量近似于零,可有效地缓解温室效应。生物质气化发电技术作为生物质能洁净利用的途径,越来越
目的:探讨活血散瘀法治疗慢性精囊炎的疗效。方法:68例慢性精囊炎患者随机分为治疗组38例与对照组30例,治疗组口服活血理前丸+琥珀胶囊,对照组口服左氧氟沙星分散片+安络血,4周为一
前列腺痛是指合并有排尿困难和骨盆疼痛的前列腺疾病,前列腺检查正常,前列腺液或前列腺按摩排出的尿液缺乏炎症的征象。属非细菌性前列腺炎的一种特殊类型。目前由于病因相当复
东北林业大学创建于1952年。近几年,加紧了校园网的扩建和改造,旨在推动学校信息化建设,最终建设一个高水平的智能化、数字化的教学园区网络。
2003年12月21-23日,由中国农业科学院蚕业研究所、国家种质镇江桑树圃主持的全国桑树种质资源研讨会在江苏省镇江市召开,来自全国11个省(区、市)14家单位的26名专家学者参加了
期刊
“间离”是德国著名理论家布莱希特专门创造出的一个戏剧术语。简单的说就是把人们所熟悉的事物陌生化,然后产生新的认识和评价。“间离效果”的作用是:“想”。即迫使观众去
目的验证围手术期使用自体血回收分离机制备富血小板血浆(PRP)的可行性及有效性,探索制备自体凝血酶并用以制备富血小板凝胶(PRG)的方法。方法选取2018年10月至2019年1月在北
随着现代信息技术的快速发展,信息技术在数学教学中的应用日益广泛,数学软件在数学学科的应用也逐渐兴起。利用数学软件的动态图形进行可视化演示以提高教学效率是课堂经常使用的教学手段。1987年2月,美国国家自然科学基金会召开专题研讨会,首次提出“可视化”,随后数学可视化逐渐成为数学教育研究中的热点领域。实现可视化技术的数学软件一般有Maple、Matlab等,可视化的研究大部分针对高等数学内容,对于中小
我校化学系原有机化学实验室建于1992年,总面积为400M~2,其中包括两个学生实验室、两个科研室、一个仪器药品室和两个准备室。因设计和施工等问题,使用仅仅3年即出现实验台面