Web服务网络分析和社区发现研究

来源 :知音励志·教育版 | 被引量 : 0次 | 上传用户:mouliyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:随着现代计算机网络技术的不断发展,服务计算研究工作也实现了较大的突破。其在当前将主要的研究重点放在了Web的发布、注册、组织以及管理工作当中,力求满足终端用户的实际应用需求。本文简要就Web服务网络展开分析,同时就该服务网络的社区发展展开相应的探究。以期为广大Web服务研究人员提供Web服务水平提升的参考。
  【关键词】Web;服务网络分析;社区发现
  SOC任务在不断发展过程中,受到来自与互联网以及计算机模式的影响,逐渐向着大数据、多样性以及复杂性的方向进行变化,最终构建了在Web服务基础上的较为复杂的系统类型。但是其所涉及的多種服务之间难以构成彼此之间的相互感知,并且其还不具备完善的语义支持,这就造成了当前的互联网服务中的信息孤岛问题频现,影响互联网的服务水平。为切实就这种问题进行解决,技术人员有必要加强对服务互联的分析,并积极站在社区发现的角度来就服务复杂系统展开研究。
  1 Web服务的网络化分析
  随着互联网中信息孤岛系统的边界逐渐向着交叉融合的方向发展,其势必会在将来呈现出多形态的基础设施特征,实现多个服务接口的有效集成、关联以及交互。所以,Web服务将成为之后互联网服务的主要内容,其主要是指WWW上数据、功能以及知识等多种资源集成后的综合体。所以,Web服务和互联网网络以及WWW之间的关系是十分密切的。
  当网络与WWW规模逐渐扩大,其复杂程度也将会不断的提升,技术人员在当前网络技术研究工作开展的同时,也就其结构与动态特性展开全面的分析,并将主要的研究工作集中于典型网络特性的研究工作当中。技术研究人员可运用多种复杂网络分析技术来就网络以及WWW的复杂性展开研究,而多种网构化软件的出现也为网络模型的研究创造了条件与平台。总结得出当前的Web服务网络正呈现出小世界特征,并不断的向着无尺度的方向进行发展。即表现为自底向上的网络模型构建,其主要是指网络服务的关系主要呈现为在通过对WSDL服务进行挖掘的基础上,根据其所表现出的互操作特性,进行网络模型的构建。
  2 Web服务的社区发现研究
  互联网社区主要是由同一兴趣或者同一目的作为主导构建的独特的小组,利用统一的网页构建相关之间的联系,Web社区发现技术就是实现这一小组构建目标的重要基础。通常情况下,Web服务的社区技术主要被分为几下几种类型。
  2.1 HITS技术
  该技术的构建是以HITS作为基础进行构建的,将社区进行重新构建,将其表示为多个hub页面相互连接而形成的核,并且利用HITS选择的有序结构程度提升。则该社区中涵盖的页面数据也就更多,这是在Web相邻矩阵特征下构建的。纯HITS算法与HITS算法一致,都是由集合选择作为第一步的算法。另外,ARC技术与Clever技术也是该技术中的重要技术类别。建立在权威页面上开展的页面搜索活动具有多种应用优势,但是该方式下实现根的集合之后,可能会出现搜索内容主题污染以及主题偏离等多种问题。造成这种问题出现的主要原因就在于HITS对所有目标赋予一致的重要性。为切实解决这些问题,技术人员现已通过在HITS的迭送公式中构建锚文件以及hub页面分解等方式来实现。
  2.2 建立在二分有向图基础上的技术
  该技术主要是指将互联网社区抽象的表示为二分有项图,而图中的各个节点集合都可被进一步的划分成不同的两个集合,并分别表示为F与C。其与上述的HITS技术不同,该技术所依靠的数据来源并不局限于特定的主题,主要是利用爬取结果来实现。其可在对数据集合进行扫描之后就社区中的所有F集合进行整理,并以此为基础确定相应的C集合,之后再利用重复包含与排除剪枝来得到全部核,而各个核都表示为社区。
  2.3 建立在流量基础上的技术
  研究人员通过对图形理论的分析,把互联网社区记成Web图中的特殊页面的集合,并以此为基础来发现社区。在某一社区当中,各个页面之间的链接密度相比各个社区间的页面链接密度更大,所以,要就Web服务中的社区进行有效的识别,则只需要就网络流量的大小进行判断。例如,在明确给出固定的主题页面集合之后,社区可被表示为这种类型的页面集合。而其中涵盖的多个页面在社区内的页面链接数量和社区外页面存在关系的链接数量相比显得更多。在该技术的实际运用过程中,支撑其运行的数据源并不是常规的静态Web数据源,而是建立在集中爬取器基础上的得到的多个页面,并在爬取的过程中建立了Web图形。简单概述这一过程可将其表述为由Web页面的某个种子集合作为起点进行爬取,之后掌握和该种子集合构建链接关系的多个相关页面,并从中确定最小割集,以此为基础产生社区。
  3 结束语
  为提高互联网的服务水平,研究人员应当以发展多功能Web服务为目标,通过对语义Web、网络以及主题建模等多种技术的综合性研究,探讨Web服务网络化发展的分析。并在这基础上就网络化的Web服务所采用的社区结构挖掘展开深入的分析,为进一步组合网络优化机制创造良好的基础,切实满足互联网用户的实际需求,体现其重要的应用价值。
  参考文献
  [1]廖晓.基于多种知识网络建模的用户创新社区知识发现与分析方法[D].广州:华南理工大学,2015.
  [2]黄发良.Web信息网络社区挖掘的关键技术研究[D].广州:华南理工大学,2011.
其他文献
美国有位记忆高手叫霍华德,他曾以1分钟阅读并记忆25000字的速度被载入《吉尼斯世界纪录大全》。有一位媒体记者对霍华德很感兴趣,决定对他进行测试。记者给了霍华德刚刚印刷完毕的《戴安娜传》——一本厚达320页的书。霍华德仅用了5分钟就阅读完毕,然后,他准确无误地回答了记者提出的9个问题,仅有一个问题——戴安娜就读过的中学名称没有回答出来。记者随即又拿出一本近500页的新小说《卧室》,霍华德用了12分
[Jarstrand C et al:J Clin Lab Immunol 5(1):67,1981(英文)] Bestatin是链霉菌的一种代谢产物,过去就发现它有促进细胞和体液免疫的作用。最近的研究表明,用Bestatin治疗
目的探讨血浆置换联合其它药物治疗抗-NMDA受体脑炎的应用和临床疗效。方法 1例确诊为抗-NMDA受体脑炎的患者应用血细胞离心机进行血浆置换(2-3)次/周,共进行6次治疗。治疗前
由于前列腺素F_(2α)(PCF_(2α))和E_2(PCE_2)能引起许多副作用,因此用它们去调节人和动物的生育力受到限制。在合成的前列腺素同系物中,现已发现许多新的解黄体药,它们的作
中国现有3.5亿烟民,占全世界吸烟总人口的1/4。其中10%为女性,而且这个数字还在与日俱增。“红唇烟雾”始自何时已无从得知——或年轻,或年长,或休闲,或职业的众多女子都在香
[Hochkeppel HK et al:Nature 291(5815):500,1981(英文)] 继Secher等1980年成功地分离了一株能产生鼠抗人IFN-α(Ly)单克隆抗体的杂交瘤细胞系,并将单克隆抗体首先用于干扰
新闻出版署的通知指出,近来,一些香港、台湾出版单位或其代理人,在大陆出卖所谓“国际书号”。有人买了这种“国际书号”,从事图书的印刷发行活动。这些行为,扰乱了图书市场
中职学生是一个特殊群体,正处于一个生理、心理都发生巨大转变的关键时期,教育发展的瓶颈在于如何把握好学生的心理健康教育,而且会在很长一段时间内成为中职教育的一个重要
在诗词歌赋中,某些句子的末字经常会用一些韵母相同或者相近的字,来使音调和谐优美,富有节奏感。而当我们听到“朝辞白帝彩云间,千里江陵一日还。两岸猿声啼不住,轻舟已过万重山。”的句子时,的确会产生愉快的感觉。人类似乎从本能上很偏爱这类句子,因为听起来朗朗上口。即使是完全没开化的住在极其偏僻地方的土著,他们对听起来有节奏感的句子仍然有所偏爱。中国现代著名学者朱光潜曾在《诗论》里有过相关的记载,一个英国人
“以前没管我,现在凭什么管?”高二女生悠的这一句话,石破天惊。虽然她已经离开了咨询室,但还是让我不断地回想。一句带着恨意的话语,每一个字都很容易理解,然而,却让我战栗