论文部分内容阅读
随着服务计算与云计算的发展,互联网上发布的Web服务数量也在迅速增长,通过调用不同的Web服务来快速搭建有创意的Mashup应用,引起了服务开发者的广泛兴趣,而如何帮助用户快速定位到所需要的服务是服务计算领域的一个挑战性问题。且据最新的统计数据表明,网络上Web服务的使用率很低,重复利用率也比较低,这就不利于Mashup应用的创新以及Web服务生态系统的可持续发展。因此,提高Web服务的利用率也是一个亟待解决的关键问题。为了解决上述问题,本文主要对Web服务之间多种多样的关系进行了挖掘,并将其应用在Web服务的搜索和推荐等方面,而且对Web服务的分类也进行了研究,具体的研究内容如下:首先,本文提出了一种高效的挖掘Web服务之间相似关系、可组合关系和潜在可组合关系的算法。它首先挖掘了任意两个Web服务之间的相似关系和可组合关系,然后基于已获得的两种关系,结合网络中链路预测的思想,来挖掘Web服务之间的潜在可组合关系。实例分析和实验表明,本文所提算法可以引导服务用户发现想要的Web服务,提高Web服务发现的效率,且能为Mashup开发者发现当前还未调用过的Web服务,提高Web服务的利用率。其次,本文提出了一种基于多种关系的流形排序Web服务推荐算法。文中利用Mashup簇之间的相似关系,Web服务之间的相似关系、可组合关系和潜在可组合关系,以及Mashup簇与Web服务之间的包含关系。并将这些基于不同理论思想的关系融入原始的流形排序算法,然后根据Mashup开发者的描述需求,为其推荐一系列相关的Web服务以供其选择。实验证明,本文所提方法不仅能为Mashup开发者推荐比较流行的Web服务,而且所推荐的Web服务相互之间具有相似关系、可组合关系和潜在可组合关系,能够很好地满足Mashup开发者的需求,提高Web服务的利用率。最后,本文提出了一种应用LDA主题模型的Web服务分类算法。考虑了Web服务的名称、描述、标签等信息,使用LDA(Latent Dirichlet Allocation)主题模型对Web服务文本进行建模,获得Web服务描述文本的主题分布,然后运用不同特征的以及理论比较成熟的KNN(K-Nearest Neighbor)最近邻和SVM(Support Vector Machine)支持向量机分类算法,对Web服务进行分类。实验结果表明,基于LDA主题模型的Web服务分类效果,比传统的基于词项统计模型的分类方法获得的效果更好,LDA主题模型能从语义的角度来把握Web服务文本的描述信息,使得分类的结果更加准确,并提高服务发现的效率。