搜索引擎条件下的互联网拓扑结构分析与模拟研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:chunhuaqiuyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网是一个开放的复杂巨系统,它一直在不断地演化并涌现出新的特征。尤其是近几年,网络资源迅速膨胀,互联网逐渐成为人们获取信息的重要渠道。互联网上的新技术、新产品、新理念,包括商业模式,都是层出不穷。几年前用户在门户网站和网址库中寻找需要的网站,这种方式相对于现在互联网庞大的信息量来说,犹如大海捞针。所以,搜索引擎出现了。现在,已经有超过70%的用户通过搜索引擎来寻找网站。而且,用户在互联网上的角色正在逐渐从被动的信息接收者转向内容创作者,社会性软件的出现正是顺应了这一趋势。这些变化给互联网的网络拓扑结构带来了怎样的变化。旧有的拓扑结构体系是否仍然适用于研究互联网的这些新特征。这就是本文要研究的问题。  作者用模型模拟和复杂网络的研究方法,结合搜索引擎等互联网的新技术、新理念,针对以上问题进行模拟分析。深化了复杂网络的研究成果,并提出了新的互联网网络拓扑结构体系。  作者对搜索引擎和网址库这两种网站查找方式的特点进行抽象,提取出两个关键差别:信息粒度和信息量。根据这两点差别分别建立采用搜索引擎和网址库进行网络资源选择的互联网的模型。通过对模型结果数据的对比,用复杂网络的研究方法分析搜索引擎的广泛使用对网络拓扑结构的影响。  研究结果表明,用搜索引擎进行网络资源选择的互联网有着明显的无标度特性。从复杂网络的角度来看,它等价于一个基于局部信息进行择优连接的BA模型。所以,研究结论与作者以前对 BA模型的研究结论“无标度网络的形成与择优选择时所使用的信息量无关”是完全一致的。  此外,作者指出旧有的拓扑结构体系已经无法反映现在的互联网各元素间的关系,并提出将用户与用户行为纳入到互联网拓扑结构体系中。一个科学的拓扑结构体系不但有助于进行理论研究,还可以帮助我们认清实际系统中存在的问题。作者将用户行为数据引入到搜索引擎排序算法中进行模拟,发现这能够帮助搜索引擎改善排序结果,证明了用户行为数据的价值。  本文通过五个部分的阐述来完成对以上研究内容的理论推演和实现。  论文首先对研究的目的和意义,目前的研究情况进行了介绍,概括性阐述了课题的背景,确定了研究的范围和内容。  在第二部分中,论文详细介绍了相关的理论知识,包括:网络结构的已有研究、无标度网络和BA模型、作者对 BA模型的历史研究成果,这些理论知识给本文对网络拓扑结构的研究提供了理论方法,此外,还介绍了搜索引擎排序技术,阐述了互联网是开放的复杂巨系统这一理论。前者是本文中模型A抽象搜索引擎排序方法的基础,后者不但为我们更准确地把握互联网的特性提供了方向,同时也是本文提出的新的拓扑结构体系的理论基础。  在第三部分中,论文对搜索引擎和网址库这两种产品的特点进行了比较,抽象出关键的差别后,建立模型并用复杂网络的研究方法对结果数据进行了分析。  在第四部分中,论文提出了要将用户和用户行为数据引入到拓扑结构体系中,这是互联网不断演化的需要。然后,建立新的采用搜索引擎的互联网模型,将用户访问量引入到排序算法中,用实验结果数据证明了用户数据的价值,也是从一个较小的角度说明了将用户和用户行为引入到拓扑结构体系中的必要性。  在第五部分中,论文指出了目前研究中的不足之处和进一步研究的方向。
其他文献
为利用元知识提高推理效率,本文从知识库中的规则的结构入手来提高推理效率。即在问题求解之前,根据所求解的问题将知识库中混乱无序的规则按可能激发的先后顺序排序,使之具有一
身体是我们自身与外在世界沟通的媒介,当今处在消费社会里的身体,其实是经济的某种延伸,它的压力、健康、美丽和性感都被市场经济所物化,从2000年前后的《圣家族》系列,到它
新时期下的素质教育要求小学的管理向科学化、人文化发展。本文从当前小学管理的科学化和人文化出发,分析了小学教育管理中存在的问题,并提出了相应的措施,仅供小学教育管理者参
在乳腺病理分析工作中,病理医生经常分析大量乳腺导管增生和导管原位癌病理图像。乳腺导管增生表现为导管腺上皮细胞和肌上皮细胞大量增生,乳腺导管原位癌表现为导管腺上皮细胞
该文借助实物实验使用一种与实际情况更为近似的与实时状态系统相结合的研究方法,在实物实验的基础上对ADRC的控制机理作进一步的分析研究.具体工作有以下几个方面:以动力调
本文着重研究计算机领域内的本体相关技术在网络调查中的应用。  本文基于本体[1]的思想,就网络调查中具体的一种调查形式——问卷调查——从理论与实践两方面加以探讨,以全
本文根据混沌理论和分形理论,对混沌特征研究的非线性科学方法进行了必要的总结,包括如下:经济时间序列关联维的计算方法;Kolmogorov熵计算方法;最大Lyapunov指数的计算;以及R/S分
学位
在电力系统中,保证电网安全、经济和可靠运行,一直是电力工作者们致力研究的重要课题,而电网越限现象是亟待研究的一个主要方面。本文针对电网越限(包括电压越限和支路潮流越限)现象,采用灵敏度分析方法对其进行研究,根据电力系统网络拓扑结构与运行方式,分别求解出节点电压的灵敏度矩阵和支路潮流的灵敏度矩阵。将灵敏度矩阵的值作为调整电网越限的依据,确定调节方式。并应用VC++ 6.0对灵敏度矩阵的形成进行编程实
本文利用符号动力学理论,在单峰映射的参数空间中找到了新的普适行为,即超Feigenbaum普适性,这类普适行为是在周期以Fibonacci序列递增的分岔过程中体现出来的,周期的递增满足加