论文部分内容阅读
大规模复杂系统仿真(Large-scale Complex System Simulation,LCSS)具有实体规模大、模型复杂、平台工具需求多样等特点,对仿真平台计算性能和易用性提出了较高要求。然而,当前云平台多是提供孤立的平台工具供用户使用,未考虑仿真模型易组合需求以及仿真实体间交互复杂的特点,导致用户使用困难、运行效率低。因此,开展大规模复杂系统云仿真支撑技术研究、实现高效的一体化云仿真服务,对满足LCSS的高效易使用需求具有十分重要的理论意义和实用价值。论文针对当前大规模复杂系统云仿真的需求和相关研究存在的问题,围绕一体化服务化仿真平台工具集成、异构仿真资源描述、仿真资源调度优化和仿真容错等关键技术进行了深入的研究,主要工作及创新点如下:(1)提出了一种面向应用的一体化服务化仿真平台工具集成框架。构建一体化云仿真服务需要实现服务化仿真平台工具的集成以及仿真模型的灵活组合,然而当前云仿真平台多是提供孤立的仿真平台工具,不易使用,且在实现仿真模型组合时需要对仿真模型进行改造,难以支持利用已有仿真模型灵活组装不同仿真应用,因而无法提供一体化云仿真服务。对此,提出了一种面向应用的一体化服务化仿真平台工具集成框架,该框架以应用为中心,把平台工具隐藏在服务中,同时利用由初始化事件、DR事件和功能事件E组成的IDE仿真对象结构对仿真模型进行封装,以支持其灵活组合,并借助XML技术实现各服务化仿真平台工具间仿真应用信息的传递,从而提供一体化云仿真服务。实验表明,该框架可为实现简单易用的一体化云仿真服务提供支撑。(2)提出了面向资源检索的异构仿真资源语义描述方法。当前资源描述未能结合动态行为和历史互连记录实现语义描述,检索性能不高。对此,提出了一种面向资源检索的异构仿真资源语义描述方法,采用本体技术,从基本信息、依赖环境、应用上下文和动态信息四个方面对不同类型仿真资源进行语义描述,并结合逻辑匹配、相似度匹配方法实现仿真资源的单独检索和联合检索。实验表明,该方法可有效提高仿真资源的检索性能。(3)提出了一种基于历史信息的仿真资源调度启发式优化算法。不同虚拟机组合方案对仿真运行性能影响较大,然而现有云资源调度方法适合子任务运行时间相互独立并可事先确定的任务,但仿真应用中各仿真实体频繁同步,其运行时间相互影响,难事先确定,导致当前资源调度方法性能不佳。对此,提出了一种基于历史信息的仿真资源调度启发式优化算法PEMOA,该方法首先利用仿真运行历史事件信息建立仿真性能评估模型PEM,以评估不同虚拟机组合上的仿真运行时间,然后以PEM模型结果为依据,结合遗传算法,搜索仿真运行时间最短的虚拟机组合方案。典型测试用例表明,PEMOA可缩短多达31.8%的仿真运行时间。(4)提出了一种基于局部协同的在线仿真容错方法。云环境中常通过复制备份或检查点方法来实现仿真容错,但前者需周期性维护副本状态的同步,开销较大;后者需回滚无故障仿真实体,仿真恢复效率不高。对此,提出了一种基于局部协同的在线仿真容错方法,该方法在传统仿真运行框架上增加仿真恢复执行模块,并结合事件缓存、消息识别以及重发/过滤机制,使得仅需恢复出现故障的仿真实体便可实现仿真正确恢复,从而支持云环境中仿真高效容错。实验结果表明,该方法能提供正确的仿真结果,并可有效提高仿真容错执行效率,扩展性好。基于上述研究成果,论文结合课题组研发的并行离散事件仿真引擎,实现了一个面向大规模复杂应用系统一体化云仿真平台SIMCloud,采用民意仿真实验测试表明,SIMCloud使用简单且运行效率高。