中国Web Graph度量和演化分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:shcxd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文较全面彻底地对中国Web Graph作了研究,包括中国Web Graph的静态属性的统计分析以及其动态演化分析,并且将其和全局Web Graph作了比较。在对中国Web Graph做静态属性的统计分析中,我们提出了处理超大规模中国Web Graph数据的算法,包括建立中国Web Graph的算法和在大规模Web Graph数据中枚举强连通分量(SCC)的Split-Merge算法。这两个算法都是通过分而治之的手段将海量数据以某种方式进行分组,分别对每组进行处理后再将结果合并,以此我们有效的解决了Web Graph数据量巨大的困难。 通过对中国Web Graph结构的研究,我们求出了中国Web Graph的宏观结构、微观结构及其结构的各种统计特征。我们还爬取了多次中国Web Graph的镜像,从页面的演化,链接结构的演化和页面的流行度等方面对中国Web Graph的动态演化做了研究,以此来分析中国Web的发展趋势。
其他文献
集成电路的发展已进入系统芯片(SOC)时代,将整个嵌入式系统集成在单一芯片上已成为现实。开发自主版权的嵌入式系统SOC芯片,对于提高产品的性能和可靠性,提高国产工控系统产
法律领域作为人工智能的传统应用领域已有了多年的研究历史,也出现了许多成功的应用系统。但在我国这方面的研究和应用还相对较少。本文描述了一个以基于事例推理(Case-BasedR
当前,随着无线通信的快速发展,人们对无线通信业务范围和业务速率提出了越来越高的要求。为了适应新的市场需求,人们已经制定了第四代移动通信系统标准,以支持视频、互联网接
多Agent系统的出现为开发复杂的分布式软件提供了新的途径。近年来,为实现基于agent的系统,人们提出了许许多多的体系结构,同时也付出了巨大的努力用形式化的方法来描述agent
本文设计和实现了组件和AUI(AutomotiveUserInterface)技术支持下的导航系统人机接口部分。 首先介绍了导航系统的整体结构和系统中HMI(HumanMachineInterface)层的功能。
随着数据库和信息技术的迅猛发展,通过其得到的快速增长的海量数据因为得不到人们的理解而变为一座座的“数据坟墓”。作为解决这一问题的重要方法,数据挖掘引起了信息产业界的
基于Web技术的B/S体系结构是当今软件开发首选的架构.由于Web技术应用的普及,传统的C/S结构与之又有不少区别,导致传统的测试方法和工具不能完全适用于Web应用系统,给Web应用
本文主要研究了动态图像序列的运动参数估计问题,它是计算机视觉领域的一个基本问题,也是图像序列分析的一个核心问题,在国民经济和国防建设中都有着广泛的应用。因此,运动参
本文针对现有环境遮片技术中仍然存在的一些问题和局限性进行研究,提出了环境遮片提取与合成的一些新的算法与实现方法。主要工作包括:(1)提出了辐射度空间上的环境遮片提取与
色彩模式转换器是图像处理软件中的一项重要内容,包含色彩模式转换和图像上当前焦点的颜色信息提取这两部分的内容。为了更好的理解色彩模式转换器的作用,文章中着重讲述了色彩