基于文本聚类和本体概念相似度的语义Web服务发现的研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:close_2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web服务作为面向服务体系结构(Service-orientedarchitecture,SOA)的一种实现,通过标准的Web协议提供服务,保证了异构平台上应用程序之间的互操作。将语义Web技术和Web服务融合便形成了当前流行的语义Web服务,语义Web服务通过使用本体概念来标示服务的功能属性,为实现服务的自动发现、组合和调用提供了可能。   在深入研究数据挖掘相关知识和本体概念层次树的基础上,本文把混合文本聚类技术和基于语义距离的本体概念相似度匹配方法相结合,对如何准确而又高效地进行语义Web服务发现做了研究,本文主要工作如下:   1)对于以OWL-S语言描述的语义Web服务,分析其源码构造,将用于描述服务用途的文本信息抽取出来并组成服务描述信息集SDID。使用VSM表示和处理它,最终将文本型的描述信息集转换为数值型的数据矩阵和相似度矩阵。在特征项的选取过程中,对特征项进行了语义化的同义词归一处理。在特征项的权值计算过程中,给出了一种基于标签位置的权值计算方法。   2)在处理计算得到的服务描述信息集的数值型数据的过程中,改进了一种基于凝聚层次和K-Means方法的HCAP算法,得到聚类质量更好的多重混合聚类算法MHC。该算法通过不断改变聚类阈值并在每次凝聚层次聚类结束后用K-Means方法优化该次聚类结果,最终得到满足用户的聚类簇。   3)基于语义距离计算本体概念间的相似度,在结合有向边深度、密度、强度等因素的基础上进行有向边权值计算,并提出了概念继承度这个概念,对于概念间可能存在的多路径问题进行了分析。还将请求服务和发布服务的功能属性参数集做了关联对应,这样可以首先计算功能属性间的概念相似度,最后通过公式转化为请求服务和发布服务的相似度。   4)设计了一个基于文本聚类和概念相似度的语义Web服务发现原型系统,并对该系统中的SDID抽取模块、VSM表示和处理模块、MHC聚类处理模块、文本匹配模块和功能匹配模块做了详细说明,最后在实验结果的基础上验证了本文所提发现方法的可行性和有效性。
其他文献
随着信息技术的飞速发展,二维条码逐渐渗透到我们生活的各个方面。通过扫描二维条码获取信息已成为我们日常生活消费中重要的便捷方式。其中二维条码PDF417目前应用最为广泛,已
无线传感器网络(Wireless Sensor Network,简称WSN)是自组织的分布式网络系统,由一种微型传感器构成,这种传感器具有无线通信能力与计算能力,它可以根据具体环境在无人操作的
在现代社会中,电能已经是一种最为广泛运用的能源形式。然而,随着现代电子技术的广泛应用,电力系统存在着大量非线性、冲击性和波动性负荷,造成电能质量严重降低。另一方面基于计
随着OCR技术的不断发展以及印刷体字符识别技术的不断完善,人们对识别的要求也越来越高。商场购物小票,它是消费者购物时由商场或其它商业机构给用户留存的销售凭据。一张小小
低压电力线载波通信(Low-voltage Power Line Communication,LVPLC)能够利用普及的电力线网络,在传输电力的同时,可以承载数据、语音和视频等信息,大量应用于远程路灯监控、
REST即Representational State Transfer(表述性状态转移)是一种真正体现Web自身的软件架构风格,是理解Web自身的关键所在,REST架构本身体现出的设计思想也正是HTTP1.1协议的
智能电网的智能性是建立在海量的,关键的,敏感的电网运行信息上的,这就需要强大的数据处理、分析和存储能力。这些海量数据的处理和存储对传统的服务器和关系型数据库来说是一个
在节能减排,建设智慧、绿色城市的大背景下,加大燃气,特别是天然气的在能源消费结构中的比重,已成为上海市能源政策的重点。上海的主要燃气分为液化石油气、煤气和天然气。随着城
21世纪是人类深海探测和开发的时代,大深度潜水器作为实现人类开发深海的重要技术手段,其重要性越来越凸显。为了适应深海工作需要,对大深度潜水器的材料性能要求而相应提高
随着互联网的普及和电子商务的蓬勃发展,大量的数据资源充斥在网络之中,人们不得不花费较长的时间选择自己喜欢的资源。个性化推荐系统的出现较好地解决了这一问题,成为当今越来