面向Mashup服务的半监督服务聚类与服务标签推荐方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:nightwish110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web 2.0时代,Web服务数量飞速增长,基于Web集成的Mashup在兴起之后,也随之急剧增加。Mashup技术为更快速、更方便地开发新的Web服务提供了可能,但服务数量的快速增长使Mashup服务的开发人员需要耗费大量时间精力来对已有的服务进行管理。面对大量的服务数据,如何通过机器学习的技术对其进行适当的分析和处理,完善对大量Mashup服务的管理效率,是当下服务计算领域的研究热门。本文基于对服务标签推荐方法的调研之上,在2016和2018年公开的两个数据集上,对比了基于监督学习的Mashup服务标签推荐方法(SL-MSTR)和基于无监督学习(服务聚类)的Mashup服务标签推荐方法(SC-MSTR)。两组数据的实验结果都表明无监督的SC-MSTR方法比有监督的SL-MSTR方法的标签推荐质量高,同时当候选标签数目变化时无监督SC-MSTR方法也始终优于有监督的SL-MSTR方法。通过对实验结果的进一步分析,发现在进行服务标签推荐时,SL-MSTR方法依赖当前Mashup服务与候选标签之间的相似度,SC-MSTR方法依赖当前Mashup服务与已有真实标签集的Mashup服务的相似度。由于后者是同类特征的相似度衡量,推荐结果更加准确。本文考虑到SL-MSTR方法和SC-MSTR方法从原理上具有较大差异,对两者的结果进行集成,以期获得推荐质量的进一步优化。实验表明,集成的Mashup服务标签推荐融合方法(FusionMSTR)使Mashup服务标签推荐的质量得到了较大提升。本文的主要工作有:(1)研究和分析常见的服务聚类方法,引入监督学习的思想,在传统的服务聚类方法的基础上,得到了基于伪标记的Mashup服务半监督聚类(S3C_PLMSC)方法,优化了传统的服务聚类方法。在公开的Mashup服务数据集上的实验结果表明本文提出的S3C_PL-MSC方法在8个指标上高于传统服务聚类方法。(2)分析Mashup服务的数据特点,研究各种传统的Mashup服务标签推荐(T-MSTR)方法后,本文将Mashup服务标签推荐问题转换成根据Mashup服务自身信息对候选标签进行偏好排序的问题,据此提了出SL-MSTR方法。在2个公开的Mashup服务数据集上的实验结果表明,本文提出的SL-MSTR方法在Precision、Recall和F1上增强了传统Mashup服务标签推荐方法的性能。(3)设计实现了基于Mashup服务聚类的标签推荐(SC-MSTR)方法。采用投票机制,将SC-MSTR方法与SL-MSTR方法进行融合,获得Fusion-MSTR方法。在Mashup服务数据集上的实验结果表明,Fusion-MSTR方法对Mashup服务标签推荐有进一步的提升效果。总体上看,本文提出的基于伪标记的Mashup服务半监督聚类方法有效提升了传统Mashup服务聚类方法。基于监督学习的Mashup服务标签推荐方法改善了服务标签的推荐效果。同时,将服务聚类加入到服务标签推荐中,再使用投票机制融合SC-MSTR和SL-MSTR,进一步提升了服务标签推荐的效果。
其他文献
目前图像分类任务在CIFAR-10、CIFAR-100和ImageNet等大型通用数据集上获得最优表现的均是基于深度卷积神经网络的方法,但深度卷积神经网络依赖大量已标注的训练样本来优化,
随着传感器网络的快速发展,环境监测等数据流应用越来越多的依赖于云服务。如今许多云服务部署在地理分布式基础设施上,即位于不同地区的云数据中心,以获得更好的性能。地理
柱矢量光束是一种偏振态呈柱对称分布的矢量光束,这种独特的偏振特性,使其在亚波长聚焦方面的特性和应用价值受到广大研究者的青睐。按照柱矢量光束电场分量在空间上的分布特
随着“中国制造2025”强国战略的提出和实施,制造业急速发展,我国从制造业大国逐步成长为制造业强国。数控系统(CNC)在现代制造业中起到了至关重要的作用,伴随着工件造型复杂度的提高,对加工精度和加工效率的要求也逐步提高,传统的加工技术已无法满足加工要求。插补算法是数控系统的核心算法,传统的数控系统只具有直线、圆弧等基本的插补算法,在进行加工时存在加工文件大、机床频繁加减速等问题,影响加工质量。NU
数字X射线成像技术(Computed Radiography,CR)被广泛用于医疗、无损检测和安检等众多领域中,其成像的关键部分是成像板上的荧光粉,目前商用的X射线荧光粉却存在着稳定性差、容
云计算产业的不断升级和技术革新,使用户对云计算提出了更高的要求。任务调度作为云计算中的核心算法,影响着用户的使用体验和云平台的服务效率。但随着任务数量和规模的不断
尼龙66(PA66)作为一种用途广泛的半结晶工程塑料,是作为高分子导热材料的良好树脂基体之一,广泛应用于电子电气、LED、换热设备、工程构件、航空航天等领域,但是随着工程技术
糖苷类化合物是糖的半缩醛羟基与另一分子的羟基、氨基、巯基等生成的缩醛,具有重要的生理活性。本文以β-D-葡萄糖五乙酸酯和氨基葡萄糖胺盐酸盐为原料,通过新颖的化学手段
乡村教育运动兴起于二十世纪二三十年代,是一场旨在发展乡村教育、培养“为农”人才、推动乡村建设、实现民族复兴的社会运动。其产生原因为:乡村教育先驱们深感中国的教育体制过分“仪型西方”,与国家实际需求不相契合,更不适配于当时饱受天灾人祸、经济破产、农民绝对贫困、乡村文化荒芜、乡村教育贫瘠的中国农村,因此亟待整改。面对如此困局,教育学人们提倡“到民间去”,形成了一系列乡村教育思想的同时,以理论指导实践,
自第一台CT机成功研制以来,X-射线技术就成为医学临床诊断的一种手段。随着X-射线技术的大量使用,射线所固有的辐射危害引起了广泛关注。低剂量CT扫描技术由于减少了对人体的辐射剂量被广泛应用于临床医学诊断,但是低剂量CT扫描会使得图像带有条形伪影和噪声,信噪比降低,影响医师对患者的精准诊断。因此如何提高低剂量CT图像的质量成为CT研究领域的一个热点。本文采用深度学习方法提高低剂量CT图像的质量,主要