中国Web Graph的性质,演化和建模

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lidawei232
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中网页和它们之间的链接构成了一个庞大的有向图,称为网络图(Web Graph)。这个图包含了丰富的链接信息和有趣的性质,比如链接数目的幂法则分布,连通域等等。对Web Graph中链接信息的开发,对于Web信息资源的建设、利用和发展都有着重要的意义。中国Web Graph是属于整个互联网全体的一个重要子集,其中包含很多本地化的特征性质,这使得对应的性质和演化以及建模可能有一些的变化。本文通过对天网在2004年的大规模中文网页链接数据的分析,获取了中国Web Graph的静态性质;通过对一百五十个网站的监控,找出中国Web Graph的动态演化信息。最后,本文在以上两个研究结果的基础上,研究了层次化的Web Graph建模方法,并用之解释一些现有的现象。这些研究对于促进中国互联网的发展有十分重要的意义。通过对中国Web Graph中网页连接结构的研究,我们可以从不同方面获取中国Web Graph的各种统计特征和性质,并通过统计网页内容和Web Graph结构的变化了解中国Web上的演化情况。在特征性质方面,本文通过大量数据统计说明了中国Web Graph上入度出度的分布,网站大小,网站入度出度和连通块大小都是服从幂指数分布的。在链接结构方面,本文通过对连通分量的分析,得出了中国Web Graph和全局的异
其他文献
霓虹灯CAD系统是一个二维矢量图绘制系统,该系统允许用户绘制常用的二维矢量图形以及导入已有的位图,来完成虚拟的霓虹灯效果图,并且可以与设计好的网格文件关联起来,实现动
态势估计属于多源数据融合的二级融合,而目标编群理论是态势估计的基础。目标编群是一种前向推理过程,其基本思想是根据一级融合输入的各威胁单元的信息,按照一定的知识采用自底
对等网络”(Peer-to-Peer Network,以下简称P2P网络)技术今年以来在学术界与产业界引起了广泛的关注,许多基于P2P网络的文件共享、数据共享、计算资源共享、即时消息传递等应
随着计算机技术的迅速发展,计算机应用领域不断扩大,网络系统的应用越来越广泛,支持分布式应用也已成为软件体系结构的基本特征,高可靠、高效率软件产品的开发模式和开发过程成为
搜索引擎解决了用户搜索信息的难题。但是,由于传统搜索引擎采用集中式架构,还存在许多问题,如服务器故障、存储容量有限、以及存储链接不能及时更新等,严重影响了搜索引擎的性能
多媒体视频监控业务虽然已经是成熟的互联网业务,但由于缺乏信令概念和相应体系,会话控制及相关的用户认证、授权和计费都比较困难,导致开展信息服务的技术门槛过高,难以通过
多年以来,面向对象编程(Object-Oriented Programming,OOP)作为软件开发领域的主要编程范式,大大提高了软件代码的模块性、可重用性,降低了软件的复杂度以及软件的维护成本。
近年来,由于IPv4地址匮乏、路由表急剧膨胀等问题,使得IPv6协议应运而生。与IPv4相比,IPv6具有内置的安全机制,增强的组播支持等优越性,而最关键的是IPv6提供了巨大的地址空
Web应用一种由前端浏览界面和后端服务器构成的软件。前端通过各种浏览器、嵌入的脚本语言和applets等为用户提供丰富的图形用户界面。后端服务器包括静态/动态网页文件、CGI
数字图像的逆半调处理是将二值半调图像恢复为连续色调图像的过程,该技术在许多典型的图像处理中有极大的实用价值。论文首先阐述了数字半调与逆半调技术的发展与现状。进一步