基于语义聚类及多维匹配的Web服务发现方法研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:a327581460
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,基于面向服务体系结构的系统设计得到了广泛应用。而作为SOA体系结构的基础,Web服务以其松耦合、平台独立、以及可以不借助第三方软硬件的额外支持实现数据交换等特点,为世界范围内的信息传递和信息共享提供了关键资源。然而,伴随Web服务技术的普及与完善,互联网中Web服务的数量及种类也在大规模增加,并且出现大量在功能、质量及粒度方面多样的Web服务。因此,如何从庞大复杂的服务集中快速准确地发现满足用户查询请求的Web服务,已成为当前Web服务发现研究中亟需解决的关键问题。本文在现有工作的基础上,以用户语义功能需求为核心,通过语义聚类缩小服务检索范围,并基于词频、静态语义以及动态语义维度下的词向量表示构建文本匹配模型,以实现在全方面获取语义功能信息的同时快速准确地发现满足用户查询请求的Web服务。主要工作如下:(1)提出基于语义功能相似度的Web服务聚类匹配方法。根据用户查询的语义功能需求,首先对Web服务描述文件进行语义解析,分别提取服务描述、服务名称以及服务I/O接口数据信息,并采用PV-DM模型对服务描述进行向量化处理。在此基础上,选择三种基于划分、基于层次、以及基于密度的聚类算法,根据轮廓系数分析对比参数设置及算法性能,以选用最优聚类算法对Web服务进行分组聚合。最后,结合整体语义功能相似度进行Web服务类别匹配,从而将服务检索范围缩小至所匹配的Web服务分组。(2)提出基于多维词向量匹配的Web服务发现方法。首先,对标准文本匹配数据集进行预处理,包括数据过滤、关键词提取、基于词频、静态语义以及动态语义生成多维词向量表示,同时基于多维词向量构建相似度矩阵以生成训练输入样本。其次,应用卷积神经网络构建文本匹配模型,学习多维相似度矩阵与匹配等级之间的映射关系。然后,对所匹配的Web服务分组中的样本数据进行处理,将Web服务发现转化为文本二分类问题(匹配类或不匹配类),并根据预测概率得分对预测匹配的候选Web服务进行排序,以找到最准确的Web服务,保证Web服务发现的准确性。(3)实验评估分析及原型设计开发。在OWLS-TC4标准测试服务集上从准确率和误差损失两方面对三组对比方法进行性能比较,从多角度分析验证了结合聚类算法与多维词向量匹配方法进行Web服务发现的有效性。此外,根据本文提出的基于语义聚类及多维匹配的Web服务发现方法流程,设计开发交互式Web服务发现原型,并通过示例对本研究方法进行模拟。
其他文献
粮食是人体的主要能量来源之一,它的储量和质量都关系着国家的发展和社会的稳定。粮食在储藏过程中常常因为霉菌、害虫等因素影响受到损害,会导致储粮的质量下降。粮食受损不仅会导致全球饥饿率的上升,而且长期食用被霉菌、害虫侵害的粮食会导致人类营养不良甚至诱发疾病。及时的检测和分离出受损粮食,不但可以减少储粮的损失,还可以避免人类产生疾病。因此,粮食质量检测工作是至关重要且刻不容缓的。本文的研究对象为发霉粒小
学位
量子资源理论对非经典的资源(比如:量子纠缠、量子相干、量子非马尔可夫等)提供了一个有效的理论框架.在量子信息处理中,纯态有非常好的应用,比如:量子隐形传态、超密编码、Shor算法以及HHL算法等.自然地,纯态可以看作是量子资源.量子纯度度量主要刻画量子态与完全混合态之间的偏差程度,定量量化纯度是量子信息理论中一个基本的问题.2003年Horodecki等人首次提出了纯度的概念,随后纯度得到了较为深
学位
兴趣点推荐系统在基于位置的服务中起着重要作用,旨在通过分析用户的历史或结合其他信息,在社交平台上向用户推荐其可能感兴趣的地点。但是,签到数据被暴露给不可信的推荐系统是一种隐私威胁,攻击者可能会根据签到数据推测出用户的一些个人信息,例如工作场所、宗教信仰和行为习惯等。因此,研究一种既能保护用户数据隐私,又能保证较高可用性的兴趣点推荐方法具有重要意义。基于扰动思想的差分隐私技术,能够提供防止隐私泄露的
学位
气候变化是全球变化最重要的表现之一,当前已涉及到人类的生存与发展。通过重建古气候变化,进而预测未来的气候变化规律一直是国内外研究的热点。中国第四纪黄土是研究古气候变化的良好载体,它记录了第四纪以来的气候冷暖交替,对于重建第四纪古气候变化具有重要意义。汉江上游位于秦岭南侧,大巴山以北,北亚热带季风气候边缘,对于气候变化异常敏感。区内峡谷盆地相间分布,受新构造运动和气候变化的影响,流域内分布不对称的四
学位
书法艺术是我国传统文化中的十大国粹之一,拥有极高的美学价值和文化意义。受书法作品保存条件限制和对书法学习的需求,将传统书法作品利用现代化技术进行数字化生成具有重要研究价值和研究意义。传统的字体生成方法大多基于人力进行手工绘制,过程复杂且受人为因素影响。随着深度学习的迅速发展和图像生成技术的不断改进,基于深度学习的字体生成方法受到广泛关注,并取得了一定的成果。但是现有方法多基于硬笔手写字体的生成,存
学位
随着全球经济发展与人类活动影响,大量新兴环境污染物(Contaminants of Emerging Concerns,CECs)经多种途径进入污水处理系统,其中药物与个人护理品(Pharmaceuticals and Personal Care Products,PPCPs)是最典型的 CECs 代表物,由于其较强的环境持久性和生物累积性,传统的污废水处理工艺很难将其去除,对自然环境和人类健康造
学位
计算机图形学算法通常被用在计算机上模拟三维的虚拟场景,为了模拟较好的三维场景,实现真实的光线效果,通常使用全局光照模型计算场景光照。全局光照算法作为计算机图形学的一个重要领域,多年来备受研究学者的关注。与传统的局部光照算法不同,全局光照算法除了计算场景中直接光线贡献的光强外,还考虑了由折射或反射产生的间接光线贡献的光强,所以全局光照会产生远高于局部光照的渲染绘制结果。光线跟踪是全局光照算法中最具代
学位
现如今,知识图谱(Knowledge Graph)已经成为大数据时代的重要工具,被广泛应用于下一代搜索引擎、智能问答和推荐等领域。基于知识图谱的问答一直是自然语言处理领域讨论的热门话题,由于自然语言处理技术日趋成熟和高质量通用领域知识图谱的相继出现,针对通用知识图谱的知识问答研究较多,且研究成果丰硕。目前,旅游领域已经出现了部分构建旅游知识图谱研究论文,甚至已经有公开的旅游知识图谱可供查阅。然而,
学位
作为计算机视觉的基础任务之一,目标检测是对图像中感兴趣目标进行定位和分类。随着遥感技术的不断成熟,尽管遥感图像的数量呈爆炸式增长,但遥感图像的利用率还是很低,航天遥感数据的利用率小于5%,航空遥感数据的利用率小于10%。如何从海量的数据中得到有用的信息?因此需要迫切发展智能的图像理解和解译方法。遥感图像目标检测技术是遥感图像理解和解译的重要研究方向,在军用领域和民用领域有很大的应用价值。随着计算机
学位
益生菌是一类活性微生物,可对人体内微循环产生一定的影响,主要起到调节肠道菌群、保持微生态平衡的作用,同时其还具备抗癌抗突变、改善酒精性肝损伤、降低血清胆固醇水平、抗炎、抗肿瘤、降血压等功效。益生菌发酵豆乳是一种具有豆乳香味的发酵豆乳制品,是将豆乳高温灭菌后通过益生菌发酵制成。不仅保留了豆乳原有的高营养价值,而且同时产生了一些有利于人体健康的生物活性物质,如:有利于降血压的活性肽、促进消化吸收的低聚
学位