论文部分内容阅读
科学工作流技术始于工作流技术在科学实验领域的应用,随着科学实验信息化的发展,最近逐渐成为工作流的研究热点。与面向控制的传统工作流技术相比,科学工作流是数据驱动的,且须保证科学实验的可重复性,还要对数据来源信息进行管理,传统工作流技术无法满足科学工作流的上述需求。
针对科学工作流领域目前存在的问题,论文首先提出了面向数据流的科学工作流模型。该模型以活动为核心元素,把数据依赖作为活动之间的联系枢纽,同时提供了数据流处理构件和活动单元操作概念。通过引入基于数据流的活动模型组合概念,使得该模型满足了科学工作流面向数据流的特性,可以构造出复合的层次化数据驱动流程模型。
基于企业服务总线所提供的调用格式转换模式和数据集成模式功能,论文为科学工作流技术的实现设计了一整套解决方案,解决了科学工作流系统的服务集成和数据集成难题。
针对科学工作流任务调度问题,论文提出科学工作流调度形式化模型。基于该模型,通过对分布式异构环境中数据驱动的静态任务调度算法HEFT的动态优化,论文提出动态任务调度方法DHEFT算法。该算法可以在运行时分析已执行的任务信息优化后续任务的执行顺序和分布,同时实现了对资源动态获取与释放功能,提高了资源的利用率。
最后,论文介绍了钱塘科学工作流管理系统的原型系统。该系统基于服务总线SOA架构,提供可视化的用户界面,实现了面向数据流模型建模工具和动态的数据驱动的任务调度技术。