大规模资源管理系统中作业自动容错管理技术的研究与实现

来源 :2008年中国计算机学会体系结构专委会学术年会(ACA08) | 被引量 : 0次 | 上传用户:strongstrongqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高性能计算系统的规模日益增大,大规模并行处理系统的可靠性问题日益突出.本文从资源管理系统的角度出发研究作业自动容错技术,提出了多作业检查点的综合管理模型,设计并实现了大规模并行处理系统中的自动故障恢复方法,可以将由系统故障引发异常终止的作业自动实现基于检查点机制的恢复运行,避免了系统运行过程中的人工干预,降低了用户程序的平均故障恢复时间,提高了系统的可用性。
其他文献
提出一种便携式地面移动机器人综合实验平台体系结构,介绍了其软、硬件组成,并通过两个实验说明实验平台适用于相关研究人员进行算法实验,测试实际算法效果,具有通用性强、便于二次开发、模块化强等特点.
在Java软件结构中,诠释是一种新的编程语言成分,目前得到广泛关注.但从诠释的可视化建模来看,UML2元模型并不支持诠释建模,而且已有的Java元模型存在若干突出问题:关系混淆、语义二义性、不能完整支持面向Aspect建模.本文尝试对已有的Java元模型进行改进,采用了模型重构方法,借鉴了UML2元模型设计.并根据MOF规范重建元模型.改进后的元模型能够正确反映诠释语义而避免二义性,也能更全面地支
无线传感器网络环境中存在大量的分布式流数据,采用传统数据挖掘体系有较严重的缺陷;根据分布式流数据的特点,引入移动代理技术,讨论了基于移动代理的流数据挖掘体系结构.针对传感器网络提出基于移动代理的分布式流挖掘的体系结构,移动代理对微型流数据进行轻量级的分类与预测,复杂的处理如多维流数据的相关性分析提交到流数据服务器工作,可应用于无线传感器网络故障诊断中.
为有效地进行普适计算环境下的数据查询和融合处理,本文提出一种基于移动Agent、适合于普适计算环境的数据处理模型,采用分簇的机制,利用移动Agent和网格计算技术进行数据处理.具体应用场景中的实例分析表明,该数据处理模型在普适计算环境下能够有效地提高数据处理速度,满足用户的多种需求,减轻数据处理中心的负担.
为了准确而及时地检测实时定位应用中的复杂事件,本文提出一种事件驱动的处理RFID数据的框架GEEP(GodEye Event Processor),将RFID应用逻辑设计成复杂事件,基于数据流上的时间图模型,给出了对象与位置之间以及对象与对象之间约束的推导方法,描述了能够有效捕捉并处理复杂RFID事件的检测引擎的设计思想.实验证明本方法极大地简化了RFID数据处理的工作,有效降低了RFID数据处理
增强现实系统中核心问题之一就是实时的跟踪定位.本文设计一个利用MEMS陀螺仪和MEMS加速计和捷联惯导更新算法的惯性跟踪器,并与视觉跟踪相结合,在视频透视式增强现实系统中实现实时跟踪交互.针对惯性传感器的时飘问题,提出一种利用电解质型倾斜仪和数字滤波相结合的方法,从而使惯性传感器的精度满足增强现实系统的要求.
当前传统处理器体系结构已难以满足科学计算的需求.流体系结构适合计算密集型应用,其中媒体应用的适用性已得到验证,而科学计算的适用性仍在探索中.由于流处理器将体系结构细节暴露给程序员,而且相较于媒体程序,科学应用的数据访问方式和数据间依赖关系更为复杂,所以优化更为直接影响着科学应用流程序的性能.本文以流体力学应用QNJ-5、光学应用LADT和Navier-Stokes方程为例进行流化,给出我们的流化方
无线传感器网络在煤矿井下获得了越来越多的应用。本文根据煤矿的特点,设计了冗余路由协议,该协议可以快速发现网络拓扑结构和路由信息变化,选择最优路由并把数据通过该路由传输出去,当有节点损坏时可以自动恢复路由.为了能够快速的恢复路由有效的传输数据.为每个节点建立了基本信息表,另外本文介绍了不同情况下路由恢复的过程.最后,为了验证本文提出的冗余备份路由协议,在NS2平台上进行了大规模的模拟.
随着大规模并行计算需要的不断增长,高端计算已经从追求单一的高性能开始转向追求综合的高效能.美国国防部高级研究计划署发布的高效能计算系统计划提出了在高性能计算领域如何评价高效能系统的基本准则,包括高性能、可移植性、高产出率等。pMatlab语言作为一种高效能并行编程语言已被广泛的研究,本文从pMatlab语言的并行编程机制出发,对pMatlab语言的并行性、两种高产出率度量展开了详细的评测.实验结果
SUSAN是低级图像处理中的一种边及角点检测方法,具有大量可挖掘的数据级并行.本文分析了SUSAN的主要程序模式,提取相应的流特征,提出了SUSAN的流式实现,并在流处理器MASA-I上获得了验证.本文结合SUSAN阐述的流式实现具有一定普适性。