基于领域本体与谱聚类的按需服务发现方法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:sunhoe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件即服务与面向服务架构技术的发展,互联网上的Web服务不断增加,且被广泛应用到软件开发中。面对网络上大量日益增长的Web服务,以及用户的个性化需求,如何帮助用户准确高效地找到其所需的服务是一个关键问题。有研究表明,已有的一些服务发现方法尚未解决用户查询模糊的问题,对用户的功能查询缺乏语义扩展。此外,对Web服务的发现是基于整个语料库中的服务进行匹配,没有对其进行有效的分类组织,导致服务发现的效率不高。针对上述问题,本文主要开展如下研究:(1)基于关联规则和改进K-means算法进行领域本体的构建。该方法首先基于支持向量机进行迭代式服务分类以得到领域词汇排序表,从中选取前h个词汇作为领域概念,然后利用关联规则和权重构建概念向量,使用改进K-means算法对概念向量进行层次聚类,经迭代得到初始领域本体,并采用WordNet对初始本体进行语义丰富,为Web服务发现时用户的查询扩充奠定基础;(2)利用改进相似度计算的谱聚类算法进一步对领域内的服务进行聚类,并挖掘服务所属的主题。该方法基于网络中节点的相似性传播原理,通过设置阈值找到与各个文档相似度较大的文档集合,进而使用Jaccard系数计算两个文档集合间的相似度,根据得到的文档相似度矩阵,借鉴图论的K路划分问题,利用NJW谱聚类算法,对Web服务文档进行聚类,同时实现文档聚类后的主题抽取,目的是降低搜索空间,提高服务发现的效率;(3)基于上述研究内容,根据“用户查询-本体扩充-主题匹配-服务匹配”的策略,进行按需服务发现,并通过ProgrammableWeb上的数据集验证了方法的可行性和有效性,最后利用Java语言实现了基于领域本体的Web服务发现系统。本文提出的基于领域本体和谱聚类的Web服务发现方法,一定程度上能够引导用户明确其需求进而解决用户查询模糊的问题,同时,能够对服务进行有效的组织,降低搜索空间,进而提高Web服务发现的效率。
其他文献
托尼·莫里森的《最蓝的眼睛》讲述了在白人主流文化压制下黑人审美价值观被异化的状况,其背后隐藏的是莫里森对白人主流文化殖民和文化霸权的理性批判。通过探讨小说中文化
<正>1产业现状陕西省城固县柑橘栽培历史悠久,距今已有2 000多年历史。城固柑橘品质优良,甜中带酸,风味独特,深受国内外消费者青睐,早在唐代就有"兴元府出贡橘"的记载。目前,
近年来,我科采用耳穴贴压疗法治疗痔瘘围手术期疼痛,收效显著。现介绍如下。……
检测精子功能、附性腺分泌物和男性隐匿性生殖道炎症是评价男性不育症的重要手段,本文主要通过介绍应用精液(浆)临床生物化学分析结果来评价男性的生育能力,相对而言,过去的
我国出版业在从大国向强国发展过程中,面临着新的机遇和挑战,如集团化改制不到位;数字与纸质出版、网络与实体书店间的生存博弈;依赖教材和系统出版发行的制度性纠结以及技术
<正>音乐作为一种视听艺术,需要学生能够从多种感官细胞入手来感知音乐形象,理解音乐内涵,解读音乐符号。音乐艺术更需要由内而外的、发自内心的去感知。虽然教师可以将音乐
目的探讨血管紧张素转换酶(ACE)基因多态性对早发冠心病(CHD)血瘀证的影响。方法运用PCR技术对41例早发冠心病(CHD)血瘀证、45例早发冠心病非血瘀证及38名正常对照组的ACE基
<正>字组成词,词组成句,句连成篇。由此可见,识字是为阅读打基础的,只有具备了一定的识字量和一定的识字能力,阅读才成为可能;学习汉字不仅仅为了阅读,也是为了写作。根据《
<正>所谓闺蜜,就是在闺房分享秘密的人。他们心灵相通,灵魂契合。一句话,一个字,就能品出幸福的味道。我们来自不同的地方,在时光的穿梭中相逢并相伴。感谢时光让我们相逢。