论文部分内容阅读
Web服务作为面向服务体系结构(Service-orientedarchitecture,SOA)的一种实现,通过标准的Web协议提供服务,保证了异构平台上应用程序之间的互操作。将语义Web技术和Web服务融合便形成了当前流行的语义Web服务,语义Web服务通过使用本体概念来标示服务的功能属性,为实现服务的自动发现、组合和调用提供了可能。
在深入研究数据挖掘相关知识和本体概念层次树的基础上,本文把混合文本聚类技术和基于语义距离的本体概念相似度匹配方法相结合,对如何准确而又高效地进行语义Web服务发现做了研究,本文主要工作如下:
1)对于以OWL-S语言描述的语义Web服务,分析其源码构造,将用于描述服务用途的文本信息抽取出来并组成服务描述信息集SDID。使用VSM表示和处理它,最终将文本型的描述信息集转换为数值型的数据矩阵和相似度矩阵。在特征项的选取过程中,对特征项进行了语义化的同义词归一处理。在特征项的权值计算过程中,给出了一种基于标签位置的权值计算方法。
2)在处理计算得到的服务描述信息集的数值型数据的过程中,改进了一种基于凝聚层次和K-Means方法的HCAP算法,得到聚类质量更好的多重混合聚类算法MHC。该算法通过不断改变聚类阈值并在每次凝聚层次聚类结束后用K-Means方法优化该次聚类结果,最终得到满足用户的聚类簇。
3)基于语义距离计算本体概念间的相似度,在结合有向边深度、密度、强度等因素的基础上进行有向边权值计算,并提出了概念继承度这个概念,对于概念间可能存在的多路径问题进行了分析。还将请求服务和发布服务的功能属性参数集做了关联对应,这样可以首先计算功能属性间的概念相似度,最后通过公式转化为请求服务和发布服务的相似度。
4)设计了一个基于文本聚类和概念相似度的语义Web服务发现原型系统,并对该系统中的SDID抽取模块、VSM表示和处理模块、MHC聚类处理模块、文本匹配模块和功能匹配模块做了详细说明,最后在实验结果的基础上验证了本文所提发现方法的可行性和有效性。