论文部分内容阅读
网格计算技术的目的是在分布、异构、自治的网络环境中实现资源共享与协同工作,当前,网格计算技术已经在生物信息、高性能物理、地质等科研领域得到应用。将网格资源有效地组织起来,分配给任务并使之高效地完成,是网格资源共享需要解决的核心问题,即网格元调度。根据网格资源和任务的特点,设计出高效率、适应性强、扩展性好的网格元调度系统,具有重要意义。本文以网格元调度系统为研究目标,主要讨论了以下几方面的内容:1.从资源管理和任务调度的角度对现有的主要网格元调度系统进行了研究。研究内容包括资源管理协议、调度模式、可扩展性、工作流支持等,并对各个系统的优缺点进行了评价和比较。2.提出了一个支持跨域资源协同分配的虚拟作业模型(VJM)。对资源选择、死锁的检测与资源重组的问题进行了深入的讨论,并提出了相应的算法。3.通过对网格应用及用户需求的归类和对调度行为的分析,抽象出通用的调度模块,提出一个可定制、可扩展的基于插件机制的元调度模型。按照该模型的思想,设计了4个具有代表性的调度插件:支持资源虚拟化的调度、数组作业调度、网格工作流调度和data-aware调度。4.实现了CSF4元调度系统。主要有三方面内容:1.通过对多种资源访问协议的分析,提出了一个支持资源访问协议异构性的资源访问模型,实现了CSF4资源访问工厂服务和针对GRAM协议、LSF协议和VJM协议的服务实例。2.基于插件的CSF4的元调度框架的实现。3. CSF4用户界面的设计与实现。5.介绍了CSF4目前的应用情况和实验数据。包括在美国国家生物医学计算资源的应用:MyWorksphere项目和Opal-CSF4系统,在环太平洋网格与中间件联盟(PRAGMA)以及Avian Flu Grid项目中的应用。对VJM和CSF4调度插件进行评估,给出了实验数据。最后进行了总结,并指出了进一步工作的方向。