论文部分内容阅读
互联网的发展正变革着互联网上的信息和服务的应用模式,互联网不仅是信息的载体,更是服务的载体。最终用户不仅是直接使用互联网上的信息和服务,也越来越多充当互联网上服务或应用程序的生产者角色,以满足其个性化的服务需求。组合服务或应用程序的构造不同于文本信息的生产,门槛高、技术复杂。虽然目前互联网环境下Web服务和开放应用程序接口的大量出现使得构造互联网应用程序变得可行,但最终用户通过组合现有的服务来构造满足其个性化需求的服务应用仍然面临很多问题。其中两个突出问题是:1)组合服务的正确性保障问题;2)组合服务的生产过程效率低的问题。这两个问题是软件工程领域的基本研究问题,有效解决上述问题能够避免组合服务的运行时错误,并提高最终用户组合服务的效率,改善用户体验。本文的主要贡献在于: 1.针对上述挑战性问题,本文提出了一种行为约束关系(Behavior ConstraintRelation) BCR模型。该模型有效抽象出了服务行为协议中局部活动之间的行为约束关系,能够在忽略全局行为状态的的情况下,精确的描述局部活动之间的行为特征,适用于在全局运行状态不可得的情况下刻画和分析服务的行为。该行为约束关系模型是本文中服务互操作匹配性检测方法以及支持未完成组合服务之间的行为相似度计算方法的共性基础,可推广应用到其它场合或算法中。 2.针对组合服务正确性保障问题,本文提出了一种基于BCR的服务互操作匹配性检测多项式时间方法。能够快速检测匹配性且能准确定位互操作不匹配发生的位置,便于采取补救措施消除不匹配的错误。本文使用Petri网理论形式证明了本方法的匹配性检测的结果与经典的弱良好定义相同,从而验证了本方法的正确性;同时,使用SAP业务流程数据对比本方法与经典检测方法的实际运行时间,基于BCR的服务互操作匹配性检测方法在实际运行时间方面具有极大优势,并且远小于基于有限状态机的检测方法。 3.针对组合服务正确性保障问题,本文提出了一种支持多样性的服务不匹配自动修正方法。该方法通过最大化修正方案的多样性来减少修正方案不满足个性化需求的风险。本文使用基于行为约束关系的修正方案之间的平均距离来度量多样性,修正方案间距离与海明距离等价。由于求解最大多样性的修正方案是NP难问题,本文提出了一种具有2倍近似度的近似算法,并提出了两种剪枝策略来有效改善近似算法的性能。近似算法在平均情况下修正方案的多样性为基线算法的2.4倍,并且两种剪枝策略均有效。 4.针对最终用户组合服务生产过程效率低的问题,本文提出了基于混合相似度策略的组合服务推荐方法。基于用户未完成的组合服务来推荐相似度最高的若干已完成的组合服务。根据未完成的组合服务的程度不同,针对性地提出了两种组合服务相似性度量方法:基于BCR模型的行为相似性度量和基于组合服务描述文档的TF-IDF内容相似性度量。这两种相似性度量方法推荐准确率和推荐效率均比经典的组合服务相似性度量方法要高,并且与人工标注数据的相关程度也较高;同时,行为相似性度量更适合完成程度更高的组合服务推荐,而内容相似性度量更适合初始阶段的组合服务推荐,从而验证了基于混合相似度的组合服务推荐方法的有效性。