论文部分内容阅读
目前,作为下一代网络雏形的语义Web得到了学术界的广泛关注和研究,而如何在语义Web上寻找到满足用户需求的语义Web服务是一个研究热点。现有的语义Web服务发现方法因为增加了对语义信息的计算而使得发现效率并不高。同时,现有的一些方法因为本体构建的复杂性只限于某些领域的使用,造成扩展性不够且匹配精度不高等问题。本文针对现有方法的问题,基于聚类思想和二分图匹配方法提出了一种新的语义Web服务发现方法,主要研究工作有如下几点: 第一,分析OWL-S语言的源码构成,抽象出语义Web服务的描述模型和服务请求模型,并给出了一个语义Web服务发现框架。 第二,给出了CSID(服务信息文档集合)的定义和提取方法,为了便于聚类操作,采用VSM(向量空间模型)表示CSID,并提出了一种基于WordNet的特征空间语义降维的方法,既考虑了特征项的语义信息又有效的降低了空间维度。 第三,针对K-Means算法的两大缺陷,提出了一种基于优化k值和优化初始聚类中心的K-Means算法(称为k-PSO-KM算法),并使用k-PSO-KM算法对CSID进行聚类操作。通过聚类将相关服务聚集在一起形成服务簇,在进行服务匹配时,只与相关服务簇中的服务匹配,避免与无关服务的匹配,从而提高服务发现效率。 第四,提出一种新的基于WordNet计算概念间语义相似度的方法,整合了基于语义距离和基于信息量两种计算概念间语义相似度的方法的优点,并且同时考虑了概念的深度和概念间语义重合度等因素,给出了一个整合四个因素的概念间语义相似度的线性加权的计算公式。 第五,将服务请求与服务间的匹配分成输入匹配和输出匹配两部分,并将输入匹配和输出匹配抽象成二分图模型,采用带权二分图的最优匹配的思想来完成匹配操作。对于带权二分图的构造过程和计算带权二分图的最优匹配过程进行了详细说明,同时,针对现有算法的问题,提出了一种新的计算概念集合间语义相似度的算法:KM-avg算法。使用KM-avg算法计算出输入相似度和输出相似度之后,通过本文给出的一个线性加权公式计算出服务请求与服务间的语义相似度。 最后,通过仿真实验验证了本文所提方法的有效性和可行性。