【摘 要】
:
随着服务计算与云计算的不断发展,Web服务的数量逐年增多,服务发现成为一个日趋重要的问题。服务发现能否成功很大程度上取决于Web服务的类别标注是否准确,但人工标注耗时耗力且容易出现错误,因此,进行服务的自动分类变得非常重要。现有的Web服务仓库中所包含的服务类别与对应的服务数量通常遵循长尾分布,即绝大多数的Web服务样本只属于少量常见类别(头部类别),而大多数类别(尾部类别)包含的Web服务数目都
论文部分内容阅读
随着服务计算与云计算的不断发展,Web服务的数量逐年增多,服务发现成为一个日趋重要的问题。服务发现能否成功很大程度上取决于Web服务的类别标注是否准确,但人工标注耗时耗力且容易出现错误,因此,进行服务的自动分类变得非常重要。现有的Web服务仓库中所包含的服务类别与对应的服务数量通常遵循长尾分布,即绝大多数的Web服务样本只属于少量常见类别(头部类别),而大多数类别(尾部类别)包含的Web服务数目都十分有限。本文对各个类别进行的分类实验表明,尾部类别由于标注样本的稀疏,其分类效果会远差于头部类别。当前大量的Web服务自动分类工作往往都直接忽略了尾部类别,只在头部类别上进行研究。除此之外,对于Web服务描述所具有的语义密度低即语义稀疏的特点,这些研究也没有提出很好的解决方案。Web服务多分类以及多标签分类是服务分类的两种典型场景,服务多分类是指为服务分配唯一的类别标签,而服务多标签分类是指为服务分配一个对应的类别集合,本文对于尾部类别上的这两种任务均给出了相应的解决方案:(1)针对小样本Web服务多分类问题,为了缓解上述的样本以及语义稀疏问题,本文基于目前主流的元学习方法提出了一种名为多元信息融合的小样本Web服务多分类方法(Multi-Information Fusion Based Few-shot Web Service Multi-Classification,MIFFWSMC)。MIF-FWSMC能够融合头部类别中以及服务类别名称中的分类信息来克服样本的稀疏性,融合训练集上的无监督词分布信息以及小样本场景中的有监督词分布信息来克服语义的稀疏性。MIF-FWSMC通过将多分类问题转化为多个回归问题来提高分类效率,使得模型能够在多个类别中快速且准确的找到服务最有可能属于的类别。(2)针对小样本Web服务多标签分类问题,本文在MIF-FWSMC的基础上提出了一种名为多元信息融合的小样本Web服务多标签分类方法(Multi-Information Fusion Based Few-shot Web Service Multi-Label Classification,MIF-FWSMLC)。MIF-FWSMLC修改了描述向量生成器,使其能够融合多个服务类别名称中的分类信息;同时还修改了分类组件,使其回归对象由概率变成了对数几率,以此提升模型的准确率和稳定性。同时,MIF-FWSMLC还能够自动学习类别正负样本的分类阈值,从而快速且准确的找出服务最有可能属于的类别集合。对于以上两类问题,论文实验部分通过在两个真实的Web服务数据集上控制每一轮小样本场景所包含的类别数目来分别构造对应的任务场景,并且从多个维度开展了相关实验验证了所提方法的有效性。
其他文献
过去,内存技术主要以DRAM(Dynamic Random Access Memory)为主。随着海量数据提出了更高的存储需求,非易失性内存(Non-volatile Memory,NVM)技术,也被称为持久内存(Persistent Memory,PM)应运而生。由于接近DRAM的访问延迟和本身字节可寻址的优势,非易失性存储器绕过了基于块的接口,可使用CPU(Central Processing
从网络开始普及至今,依赖互联网发展的行业发展势头都十分迅猛,包括曾经大家视之为洪水猛兽的游戏行业也发展得风生水起。尤其是我国网络游戏市场一跃成为了全球顶尖。与此同时,游戏行业相关的收入确认也应该引起重视,并予以规范。新收入准则的颁布,一定程度上填补了对于网游行业收入确认规定的空缺,但在企业实际操作时,难免因为运营模式等存在或多或少的问题。文章以资产负债理论和收入费用理论为基础,同时研究了新收入准则
空间营造是多主体共同参与的过程,是对空间“生产论”和场所“构建论”的调和。民族地区文化遗产资源丰富,驱使着当地文化旅游空间朝着遗产型方向发展。卓克基地区土司文化遗产、红色文化、嘉绒藏文化、宗教文化等人文资源聚集,并且生态环境良好,为空间营造提供了丰富的文化与自然资源。由于各种文化遗产资源本身具有宝贵的历史与当代价值,辅之以政府、文化精英等外部推力,民族文化遗产的保护与传承需求,民族地区发展的要求等
人类注意系统经感知觉获得的大量信息中只有很少一部分能在注意选择后得以进一步加工,从而严重限制了我们在任何特定时间点有意识地获取相应的信息的能力。在时间维度上对目标刺激进行连续加工时引发的对其它刺激的功能性盲视现象被称为注意瞬脱(Attention Blink,AB)。情绪性刺激相比于中性刺激和其他刺激会造成更大的注意瞬脱,已有研究表明T1为情绪性刺激,T2为中性刺激时,注意瞬脱的大小和持续时间主要
伴随着数字技术的进步,从电子游戏脱胎出来的电子竞技其社会地位不断提升,对于电子竞技我们不能再以曾经对待电子游戏的视角去看待,电子竞技不仅是一项正规的标准化的体育运动,而且在各种电子竞技活动中,我们需要看到更深层次的内容,这些内容正在潜移默化地推动着数字时代的游戏化生存问题。基于此,本文以巴赫金的“狂欢理论”作为理论支点,以电子竞技的代表——《英雄联盟》S11赛季为例,采用网络民族志的研究方法,通过
基于测试数据包的故障定位是网络故障排除领域的重要研究方向。目前,基于测试数据包的SDN故障定位方案有两条路线:一条是使用逐规则测试,一条是使用逐路径测试。前者为目标网络的每条待测规则生成一个测试数据包,后者将位于不同交换机上多条待测规则连接为目标路径,为每条目标路径生成一个测试数据包。两条路线的框架相同:首先在数据平面安装捕获规则,然后在控制平面生成所需的测试数据包,下发到对应的交换机。测试数据包
四川省一直是中国的人口大省,也是劳务输出大省,人口长期处于净流出状态。但是随着中国西部大开发、成渝双城经济圈建设等国家重大利好政策的实施,四川省流出省外人口出现了回流,并且吸引了省外人口的流入,省内流动人口也大幅增加。在这样的背景之下,四川省不仅在经济上有所发展,人口的流动和流向也发生了变化,因此对四川省人口流动现状和影响分析至关重要。经济与人口流动息息相关,本文对四川省的经济和人口进行了具体分析
从经济欠发达、资源条件稀缺向经济发达且资源条件优渥地区的人口流动一直以来是一种常见的移民基本定律。然而明清时期大量人口向山区流动,并主动的对山区进行开发的现象却与常见的移民规律相违背,这是日益增长的人口与土地资源有限形成的矛盾和流动人口不断尝试更多可能的生存空间共同影响下产生的结果。以位于川陕楚交界处的鄂西北山区为例,山谷厄塞、林箐蒙密的环境由明到清一直吸引着大批流动人口前往定居和开发,面对流民禁
数字世界与物理世界的深度融合是人机交互产品的未来发展方向之一。与当今主流的图形用户界面(GUI)相比,有形用户界面(TUI)利用数字功能来增强和丰富现实世界。在有形交互设计二十多年的发展历程当中,旨在提升用户学习水平的有形交互产品——有形交互学习系统逐渐成为重点的实践与研究对象。作为有形交互设计的主要应用领域之一,有形交互学习系统已有大量的设计实践。有不少学者在有形交互学习系统的实践当中,提到了认