基于内容语义和网络结构的Web服务分类方法研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:digitalmachinec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,Web服务数量迅速增加,Web服务发现成为了最具挑战性的任务之一。大量研究表明:从海量的Web服务数据中将功能相似的Web服务进行分类可以明显提升服务发现的效率。当前Web服务分类研究主要聚焦于对Web服务描述文本隐藏的内容语义信息或者Web服务描述文本中的网络结构信息分别进行独立挖掘。由于Web服务的功能描述文档的特征稀疏离散,目前许多模型无法对其进行良好建模,并挖掘其词序信息和上下文语境信息,从而影响了Web服务分类效果;很多研究工作亦未考虑到Web服务描述文档的单词与其本身之间隐含的网络结构信息;且很少有Web服务分类研究将Web服务描述文本的内容语义信息和网络结构信息融合起来综合考虑。本文聚焦Web服务描述文档的内容语义信息和网络结构信息,从不同角度选择合适的神经网络模型与表征模型针对Web服务描述文本进行深度挖掘,应用于Web服务分类,取得了较好的效果。本文所作出的主要贡献如下所述:1.针对Web服务描述文本篇幅较短、特征稀疏、信息量少等特点,本文提出了一种基于广度学习和Bi-LSTM模型的Web服务分类方法。首先,利用广度学习模型对Web服务描述文档中所有的离散特征进行组合并实现服务类别的广度预测,然后,使用BiLSTM模型深入挖掘出Web服务描述文档中词语的语序及上下文语境信息,用于实现Web服务类别的深度预测;最后,使用线性回归算法,整合Web服务类别的广度预测及深度预测结果,作为最终服务分类的结果。2.针对Web服务描述文本中的单词与描述文本本身之间所隐含的网络结构信息的深度挖掘问题,本文提出一种基于图卷积神经网络的Web服务分类方法。首先将Web服务描述文档作为基础语料库,构建一个基于单词共现和Web服务描述文档词关系的“单词&Web服务描述文档”异构图网络。在该异构图网络中,使用词频-逆文本频率计算Web服务描述文档节点和单词节点之间边的权重,采用点互信息计算不同单词节点之间边的权重。最后,面向“单词&Web服务描述文档”异构图网络,利用图卷积神经网络学习单词和Web服务描述文档的表征信息,将Web服务文档分类问题转化成节点分类问题。3.提出了一种将Web服务描述文本的内容语义信息和网络结构信息融为一体的Web服务分类方法。首先运用Doc2Vec算法深度挖掘Web服务描述文档的功能语义信息并得到其内容语义表征信息,然后使用LINE算法对利用Web服务描述文档和标签信息构建的Web服务网络进行嵌入并获得其网络结构表征,最后融合Web服务的内容语义信息和网络结构信息进行Web服务分类。该模型可以应用于Web服务发布中心从而实现高效的Web服务自动分类。
其他文献
相比普通活性污泥,好氧颗粒污泥具有密实的结构、较强的耐冲击负荷性能、较高的生物量、良好的沉降性能以及去除污染物的能力,因此受到国内外研究者的普遍关注。然而目前大部分关于好氧颗粒污泥的研究一直基于较高或者中等有机负荷污水,对低有机负荷条件下如何快速实现污泥颗粒化并保持稳定运行却鲜有报道。针对此现状,本文通过对好养氧颗粒污泥的形成和特性、对污染物的去除效果以及微生物群落结构的研究,揭示低有机负荷下不同
如今的信息化世界中,人类越来越多的通过网络来获取信息资源和相互交流。近年来,各类门户网站和社交网站的访问量呈指数级增长,网络用户根据自己的需求查看不同的网页新闻和
作为我国经典民间传说之一,白蛇故事一直是诸多文人的书写对象。其中清代玉山主人的《雷峰塔奇传》是继拟话本《白娘子永镇雷峰塔》之后,一部以章回体小说体裁来叙述白蛇传说的叙事文本。它吸收了之前多种版本中白蛇传说的情节并加以发展,以全知叙事视角为主,并以第三人称限知视角的不断转换进行叙述,从而突出了许汉文与白蛇的主人公地位,丰富了人物形象。同时,在叙事过程中作者还运用了直线型叙事时间中兼具预叙、倒叙等时序
数字图像融合是利用传感技术对同一目标或场景的多次成像,按一定规则合成一副新图像的数字图像处理技术。结果图像能更好的反映原始图像的信息,综合描述了场景或目标,在计算
股份增持是资本市场一个常见的市场行为,从2005年股权分置改革至今,中国A股市场已经出现了四次大规模的大股东增持浪潮。股份增持通常发生在市场环境萧条或者底部行情区间,其
私募股权投资(Private Equity,以下简称“PE”或“PE投资”)近10年来在国内发展迅猛。根据Zero2IPO Group的基金市场数据统计,2016年股权投资市场募资总额超过1万亿元,新募基
随着大数据、云计算等信息技术的蓬勃发展,特别是随着5G时代的到来,互联网中各类应用不断涌现,数据规模急速增长,人们难以从海量数据中发掘自身需要的信息,进而引发严重的信息过载问题。推荐系统作为当下解决信息过载问题的有效方法之一,能够高效地帮助用户发现其潜在感兴趣的项目,已成为当今科学界持续关注的热点话题并得到广泛应用。然而传统推荐算法受限于数据稀疏性以及冷启动问题,导致推荐性能下降明显。近年来,深度
汽车产业是国民经济和社会发展重要的战略性、支柱性产业,也是制造强国建设重要的标志性产业,对带动产业结构调整、推动制造业转型升级发挥着重要作用。中国汽车产业在国家政策和市场需求的引导下,快速成长为世界汽车产业的重要组成部分。然而在中国汽车产业发展迅速的情况下,也逐渐显现出来一些问题,最为突出的就是由于中国汽车产业的快速扩张,导致了产能利用率低下、成本居高不下、资源浪费严重等问题。究其原因主要是中国汽
有机-无机卤化物钙钛矿太阳能电池在近几年之内得到了广泛的研究,光电转换效率已经从最初的3.8%提升到了 22%以上。其特点是合成工艺简单,光吸收系数高,载流子扩散距离长等。
公路工程施工过程中,一方面针对施工过程中的众多利益相关者的利益诉求既有重叠又有冲突,项目管理者应当如何平衡各方的利益;另一方面,针对公路工程施工过程中管理目标众多,如进度、费用、安全、质量、环保和技术创新等,项目管理者如何针对不同的工程选择出主要的管理目标进行管控,从而将有限的资源合理利用,做到有的放矢。此外,在工程施工过程中需要对未来发展做出可靠预测,帮助项目管理者做出科学决策。在公路工程施工阶