面向高效能计算的大规模资源管理技术研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：guohaohao

【摘要】

：

高性能计算发展到今天,已经从单一地追求高性能转向致力于实现系统的高效能,提高系统的实际性能、可编程性、可移植性和健壮性,降低系统的开发、运行以及维护成本。然而,由于

【作者】

：

卢宇彤

【出处】

：

国防科学技术大学

【发表日期】

：

2009年期

【关键词】

：

高效能计算资源管理可扩展可靠性能耗管理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高性能计算发展到今天,已经从单一地追求高性能转向致力于实现系统的高效能,提高系统的实际性能、可编程性、可移植性和健壮性,降低系统的开发、运行以及维护成本。然而,由于百千万亿次以上高性能计算机系统具有规模庞大、结构复杂和组成异构多样等特点,为了实现高效能目标,系统必须解决实际应用的持续性能难以提升、管理效率低、可靠性差、能源消耗巨大等多个挑战性问题。这些问题对高效能计算机系统的大规模资源管理系统在性能、功能和可扩展性等多个方面提出了很高的要求,大规模资源管理技术成为高效能计算机系统实现的一个重大挑战性技术问题。论文以我们自行研制的可扩展共享存储(S2MP:Scalable Shared Memory Processing)体系结构的高性能计算机系统上的大规模资源管理系统实现为基础,以面向高效能大规模并行计算机系统的高效资源管理技术为主要研究内容,在资源管理模型、资源管理系统的可扩展技术、综合优化的调度机制、用户作业自动恢复的容错管理方法以及系统能耗管理技术等方面展开研究,本文主要工作和贡献如下:1、提出了大规模并行计算机系统的深度资源信息模型DRIM,克服了传统资源管理系统所关注的资源对象粒度过粗和资源描述能力不足的问题,针对高效能计算系统的特点建立了实体模型、功能模型和应用模型,更加全面、准确地描述了计算资源、通信资源、存储资源、多模式应用等各方面的特征,并将资源对象之间的关系模型化,使得管理策略更有效,管理功能可扩展性更好,为大规模并行系统高效的作业调度与资源分配提供了有力支撑。2、设计了动态层次式级联资源管理结构,提出了基于自组织方式的级联服务动态创建方法,优化了资源管理系统的通信协议,设计了轻载的传输协议来减少大规模资源管理开销,采用硬件通讯机制实现高效的控制消息传递,通过全局操作与综合优化实现大规模作业的快速加载,解决了资源管理系统的规模可扩展问题。采用基于构件的系统实现结构支持资源管理的功能扩展。在由2048个多核处理器构成的S2MP体系结构的系统上进行了资源管理系统的实现和测试,测试结果表明系统具有良好的可扩展性。3、提出了基于综合优先级的调度策略,综合考虑系统的作业属性、资源属性和服务属性中的多个因素,提升了调度机制的灵活性和有效性;设计了可变深度的回填调度策略MC-Backfill,实现了根据队列实际状态对Backfill的深度和频度的动态调整,较好地协调了系统的公平性目标和高吞吐率目标的实现。系统测试表明,MC-Backfill策略可以在用户对作业执行时间估计不准确的情况下较好地减少作业平均等待时间,提高系统吞吐率。4、建立了一种高性能计算系统的故障分布模型,提出了基于Checkpoint/Restart的作业容错执行时间模型;设计了面向可靠性的检查点周期选择算法和最优结点集合选择方法,增强了系统中作业运行的可靠性;实现了基于Checkpoint机制的作业自动容错,避免了系统运行过程中的人工干预,降低了系统的平均故障恢复时间,提高了系统的可用性。5、结合系统级和应用级的能耗管理技术,从资源管理系统的角度研究了全系统能耗管理,设计了能耗约束条件下的资源分配方法进行系统级的结点能耗管理;提出了基于负反馈的两级能耗管理模型进行应用级的能耗管理,基于访存带宽和I/O带宽的利用率,采用线性控制和模糊控制相结合的方法动态调整并行应用线程和进程数目,适时将空闲处理器核关闭以节约系统能耗。并给出了对能耗控制管理有效性的测试和分析。

其他文献

我国风景名胜区管理体制研究

长期以来,我国风景名胜区发展所面临的还不仅仅是基础设施薄弱、人员素质不高、资金投入不足的困难,更大的困难是管理体制不顺、经营机制不活的现实,这实质上就是风景名胜区

学位

风景名胜区管理体制模式

基于ITIL的高校IT服务管理系统的设计与实现

随着高校信息化建设的不断深入,校园网不断延伸和拓展。一方面,学校教学、科研和管理等工作对校园网的依赖程度不断增加,另一方面,校园网的自身复杂程度也不断增加。传统的高

学位

IT服务管理ITIL流程设计J2EE工作流引擎

进口大豆对国产大豆生产的影响研究

自20世纪90年代以来,我国由大豆的出口国,变为最大的大豆进口国,进口大豆对我国大豆产业造成巨大的冲击,国内大豆产业面临严峻挑战。本文分析国内外大豆产业现状,运用"显性"

期刊

大豆产业进口比较优势

C程序内存错误静态分析技术研究

计算机软件在当今社会中发挥着越来越重要的作用。无论是在人们的日常生活中,还是在一些关键系统中——例如银行系统,飞行控制器和医疗系统——都大量地使用软件。软件运行的

学位

程序分析形态分析内存泄漏空指针解引用SUIF2

信息技术在当前我国税收征管中的运用

本文分析了税收征纳双方的信息不对称问题及其风险,进而提出了充分利用现代信息技术手段解决征纳双方信息不对称问题,完善税收信息管理机制,加强业务与技术的融合,提高税收征

期刊

信息技术税收征管

基于Multisim的单管共射放大电路仿真分析

实验教学在电子专业教学体系中发挥着举足轻重的作用。随着计算机技术的飞速发展和电路仿真软件的不断出现,很多高等学校通过计算机把教学内容、实验设备、教师指导、学生操

期刊

虚拟实验室Multisim仿真分析

高中生物命题功能及原则探析

<正>纵观整个教学过程,我们的视角往往停留在备课、上课和实验教学上,其实"命题"也是高中生物教学过程中一个不可或缺的环节,有助于对学生学情的考察,根据学情教师可以对教学

期刊

高中生物教学光合作用强度

在固相有机合成中应用的含羟基的聚合物载体

本文重点介绍了目前实验室和市场上可用于固相组合合成的含羟基的聚合物载体及其主要的化学反应性能。

期刊

羟基树脂固相有机合成的聚合物载体

工程兵国际救援行动过程分析与效能评估

中国地震灾害紧急救援队经过几年来的开拓性发展,完成了多次具有减灾实效的成功救援行动。然而,由于我国救援事业起步较晚,整体水平还有待提高。本文以中国国际救援队成立后

学位

地震救援过程分析效能评估

舆论反恐——论恐怖主义袭击事件报道

恐怖主义袭击不仅是一种暴力恐怖活动,还是一种暴力传播行为。在对之进行严厉的暴力打击的同时,也极其有必要调控公众情绪,凝聚一切反对恐怖主义的力量,建构同仇敌忾的舆论环

期刊

恐怖袭击危机传播议题设置核心话语危机修辞

面向高效能计算的大规模资源管理技术研究与实现

与本文相关的学术论文