论文部分内容阅读
随着服务计算技术的广泛应用,提供同一功能的Web服务越来越多,能够提供增值功能的组合服务也越来越得到人们的重视。然而,如何能够在大量实现相同功能的Web服务中选取出一组服务,使得组合服务具有良好的质量、较高的用户满意度已经成为一个亟待解决的问题。目前,对组合服务选取问题的研究已有很多,大多数是基于QoS的组合服务选取方法。该类方法理论上能够使选取出的组合服务在满足消费者约束的前提下,具有最优的服务质量。然而,在真实的服务选取环境中,该类方法面临着诸多实际问题。首先,现有的服务计算技术不能够为组合服务端提供各备选服务的准确QoS数据,致使选取时所依赖的前提信息不准确;其次,组合服务中的各基本服务间存在着复杂的关联关系并影响着彼此的性能,进而影响了选取结果的质量;此外,每个Web服务都具有其自身特征,在不同的环境状态下有着不同的性能表现,在服务选取时很难用唯一的QoS值对其进行准确衡量。现有的服务选取方法缺少对上述问题的考虑,从而使得选取出的理论上最优的组合服务在实际运行时并不是最优的,甚至不能执行,降低了各种选取方法的实际可用性。为了解决上述问题,本文提出了一种基于执行信息的组合服务优化选取方法。该方法利用数据挖掘等相关技术,基于组合服务执行时采集的特定信息,挖掘得到可用于组合服务优化选取的各类知识模式,并用它指导组合服务的选取,以针对各问题优化选取结果。围绕着该方法,本文在以下方面展开了深入的研究。(1)为了获取本文方法挖掘所依赖的组合服务相关执行信息,对Web服务日志记载技术进行了研究,给出了一种基于API Hook日志记载器的组合服务通用日志获取框架,该框架能够方便地配置在服务组合系统中,灵活地采集组合服务的执行数据。(2)针对选取时所依赖的备选服务QoS数据不准确问题,对基于执行日志的Web服务QoS获取机制进行了研究,提出了一种基于Web服务TQoS值获取的组合服务优化选取方法。该方法考虑了基于实际执行获取Web服务QoS数据所存在的采集数据量小和分布不均匀等问题,分别给出了基于采样密度的有效时间段确定方法和基于Lagrange插值的QoS点数据填充方法,能够准确地提取各备选服务的QoS数据,有效地指导组合服务的优化选取。(3)针对基本服务间存在着复杂关联关系并影响组合服务性能的问题,对考虑服务间关联关系的组合服务选取进行了研究,提出了一种基于SESE分解的服务关联感知的组合服务优化选取方法。该方法通过在组合服务以往执行实例集中挖掘得到频繁一起使用的高效的SESE模式,产生对服务流程的划分,从而实现以模式为单位的多服务整体选取,以优化服务选取效果。(4)针对每个Web服务具有其自身特征而难以用唯一QoS值准确衡量的问题,对组合服务选取过程中如何考虑各备选服务特征的问题展开了研究,提出了一种基于Web服务特征分析的组合服务优化选取方法。该方法通过定义“特征规则”的概念来对Web服务特征进行形式化表示,并给出了其挖掘方法,最后分析了如何将挖掘得到的Web服务特征规则高效地应用到组合服务优化选取中。(5)针对真实选取环境中各实际问题往往同时存在的特点,对如何综合应用各组合服务优化选取方法进行了研究,给出了一种各组合服务优化选取方法的综合应用过程,能够有机地将上述优化选取方法结合起来,提高实际环境中各组合服务选取方法的性能。(6)为了有效地对本文的组合服务优化选取方法进行验证,设计并实现了组合服务自适应阶段性优化实验平台,并在平台上进行了实验分析,结果表明,文中所提出的各优化选取方法能够逐级提高选取出的组合服务性能,有效地增加应用它的各种选取算法的实际可用性,是对组合服务选取所面临各实际问题的一种有效解决方案。