基于标签推荐的Mashup服务聚类研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:hexqi666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着服务计算和云计算的发展,各种各样的网络服务涌现,极大地促进了面向服务的网络应用及软件系统构造。传统的Web服务是基于SOAP协议、用WSDL文档进行描述的,它广泛应用于互联网的各个领域,但也暴露出不少问题,如技术体系过于复杂、可扩展性较差等缺点。而轻量级的基于RESTful的Mashup服务,由不同功能的Web API进行组合而成,可以开发出满足个性需求的软件应用。然而,相比于传统的Web服务,Mashup服务没有规范的形式化描述模型,从而也就加大了其服务查找与发现的难度。Programmable Web网站作为一个流行的在线社区,允许用户发布Mashup,并且对Mashup进行标注、排序,同时它也存在服务人工标注的随意性、服务分类不太合理、服务搜索及发现的效率与精确度不高等问题。因此,Web服务的发现和挖掘便成为一个热门研究方向,而合理有效地利用标签信息进行服务聚类,从而改进Web服务发现的性能得到越来越多学者的关注与研究。本文围绕基于标签推荐和服务聚类开展了如下工作:1、提出了一种新颖的融合K-Means与Agnes的Mashup服务聚类方法MSCA。该方法首先对Mashup服务中的Tag标签进行扩充和排序;其次,计算Mashup服务的集成相似性;接着,应用K-Means算法对Mashup服务相似度矩阵进行聚类,找到相似度较高的Mashup服务将其划分到N个原子簇中,再利用Agnes算法对N个原子簇进行层次聚类,与以往方法相比,服务聚类效果及服务发现的精度有较大提高。2、提出了基于LDA标签辅助的Mashup服务聚类方法MT-LDA,该方法首先对数据进行预处理,利用LDA为语料库建模,运用Gibbs抽样方法进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布计算文本之间的相似度,最后根据文本相似度矩阵进行Mashup服务聚类,并评估聚类效果。通过对比实验表明,引入LDA方法引出资源的隐含主题,同时利用标签信息进行服务聚类,能够显著地提高服务聚类的性能。
其他文献
图像去噪模型与算法的研究是图像处理研究的核心内容之一,图像去噪过程中保持图像的细节信息是非常重要的。研究有利于图像细节保持的去噪模型及算法,可以为图像分割、图像复
本文的研究对象是专家系统构造工具DEST(Distributed Expert System Tool),该工具使用Visual C++6.0环境编写,采用了MFC应用程序框架进行编程。本文的研究目的是通过对该系统
通过对大量脱机手写体汉字样张的统计和分析,采用先粗切分再精细切分的思路,对脱机手写体汉字样张图像进行切分。在对图像进行预处理后,利用水平投影进行行切分,对于文本行书
学位
颜色名称是人类接触颜色的语言标签。用机器模拟人类感知系统来识别颜色,并通过颜色名称进行标注,有助于识别确定物体的颜色。颜色命名算法有许多实际应用,例如:使用颜色命名
Demarco曾经说过:“没有度量就不能控制”。软件度量的重要性日益被软件行业所认可,越来越多的软件组织开始建立软件度量过程以更好地管理软件过程。但软件度量过程的实施非常
虚拟肝脏手术计划系统能够提供可交互操作的平台,仿真模拟手术过程,从而有助于制定合理的个体化手术方案,可以降低损伤肝脏重要结构的危险,减少术后肝功能不全的发生率。作为
面向服务的计算发展日新月异,面对互联网海量的功能属性相近的服务,如何从大量服务中选择出符合用户自身个性化偏好的服务,如何从候选服务中为使用者推荐迎合其需求的服务,这
计算机技术和网络技术的不断发展,使得一些无纸化且随机选题的练习和考试方式越来越多地应用于各种计算机考试系统中,这种应用的实现离不开电子试题库。通常在电子试题库中,
皮肤听声是一门新兴的信息理论,它是一种解决耳聋患者听觉问题的新技术,基于皮肤听声技术的变压式皮肤听声器已经实现,它能够使耳聋患者通过皮肤来获得对外界的声音感觉。