网格环境下并行模拟器的任务重调度

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wbmissing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展和应用的深入,对它的研究显得越来越重要和必要。模拟作为一种不可替代的网络研究方法,在网络规模的扩展和网络性能评价的准确性方面临了更高的挑战。研究界针对大规模网络模拟对计算和存储资源的依赖提出两种解决方案,一是希望通过分析抽象来减少对资源的消耗实现网络规模的扩展;二是通过采用并行模拟技术来改进模拟的规模和速度。本文主要针对在第二种解决方案的实现过程中所面临的容错问题进行研究,目的在于使并行分布式大规模网络模拟能更好地利用网格的资源优势,提供可靠持续的模拟服务。本文以并行分布式网络模拟器PDNS为研究对象,设想通过为其实现应用级的检查点和恢复功能,提高它的容错能力,从而可以可靠、持续地在分布式或网格环境中运行PDNS模拟任务。当运行模拟任务的节点出现故障时,可以利用检查点文件进行进程迁移,然后在网格调度系统新提供的资源上恢复运行,这还涉及到其余模拟节点进程的一致性回滚。文章首先将阐明选择应用级实现检查点和恢复技术的依据,随后将介绍“基于任务进展描述的应用级检查点”作为理论模型和技术参考。进而通过深入分析PDNS原理、结构和实现,抽象出PDNS运行时的状态数据,并定义相应数据结构保存其在检查点时刻的能保证正确恢复的状态信息。为确保各分节点及RTI检查点信息的一致性,需要明确给出保存与恢复的流程,以及恢复网络通信的方法。最后在实现了PDNS应用级检查点和恢复功能的基础上,力图给出并行模拟任务在网格中的容错重调度系统。该系统结合网格的资源管理和任务调度功能,提出并行模拟运行在网格平台上的方式,即如何利用网格的错误监控和定位,及时发现错误,如何利用网格的任务调度在新资源上及时恢复且保证效率,最终得以透明地在不过多损失原有计算量的基础上持续运行。同时,为保证课题完整性,结合课题组的研究成果,给出一个考虑应用生存性的网格应用管理系统。
其他文献
逻辑推理是人工智能的基础,而逻辑中的一阶谓词逻辑是使用较为广泛的知识表示方法,因此研究一阶谓词逻辑的推理问题是一项很有意义的工作。在前人研究的基础上,借助Petri网中的
近几年来,随着云计算的快速发展,服务提供商越来越倾向于将本地数据部署到云上。然而,一些安全方面的问题随之而来,一方面,云数据提供商不希望自己的数据被云服务提供商窥视,
为保证有效合理地施用农药防治农作物病害,农业生产者必须准确的获取作物的生长信息,这样,农业生产者可根据获得的病害信息快速、准确的诊断受害作物的病因以及受害程度,因病治宜
随着生产力水平的提高,农业信息化现以成为我国农业发展的主要方向。近年来,越来越多的人工智能技术被应用到智能决策支持系统(DSS)的研究与开发中,以期改善问题求解的过程和
本文详细介绍了网格操作系统中资源监测服务的研究与实现。通过对网格操作系统的深入研究,发现网格操作系统虽然能够管理上千台计算机协同工作,但用户却无法查看整个机群的运
数据挖掘是从大量数据中提取出有效的、新颖的、有潜在作用的、可信的、并能最终被人理解的模式的非平凡的处理过程。序列模式挖掘作为数据挖掘的一项重要研究内容,用于从各
基因芯片技术是联合了生命科学与信息科学这两大学科研究成果的一项崭新技术,现在已成为大规模提取和探索生物分子信息的高效方法之一。同时基因芯片技术也逐渐成为生物信息
本文提出了一种基于VB的化工设备标准件图库的开发研究,并完成系统软件的设计,建立了化工设备标准化零部件数据库,实现了设计、绘图的自动化。该系统在给定基本参数条件下,通过人
随着互联网规模的迅猛发展以及网络应用种类的不断增多,研究网络行为和性能成为了一项艰巨而又重要的任务。网络模拟作为研究网络行为性能的一种工具,发挥了重大作用。传统的
Internet和Web技术的发展为现代小区物业管理系统提供了新的管理理念和技术支持。目前,面向Web的应用程序开发的技术有很多。本文选择J2EE技术框架下的Struts web架构来实现