论文部分内容阅读
网络的研究有很长的历史,随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息,如何有效的去发现我们所需要的信息,就成了一个很关键的问题。 “小世界效应”是1967年Milgram提出的,他描述了一个实验,将信在熟人之间传递,并推断很多表面上看起来距离很远、彼此陌生的人实际上被一条通过熟人的非常短的链连接起来,而且这个链的长度大约是6。在许多最近的研究中,Watts D.J.和Strogztz S.H.等人使用“小世界网络”来说明存在捷径的网络结构,提出Internet,World Wide Web和其他许多真实世界中的网络属于“小世界网络”。 既然Web是小世界网络,那么Web中的两个网页之间肯定存在捷径。我们怎样在只知道局部信息的情况下将此捷径找出?怎么帮助使用者从数量庞大的Web页中找到他们真正需要的东西?内容和链接信息通常被所有的搜索引擎用来进行爬行、索引、检索以及排序。基于这些线索的相似性方法和网页之间的语义结合的关系是决定任何搜索工具性能的关键。本论文在参考了大量国内外有关科技文献的基础上,对搜索引擎算法作了较深入的研究,并结合小世界的相似性方法给出了可行的算法,主要提高了搜索引擎搜索结果的准确性。 本文由三部分组成:第一部分讲述搜索引擎的代表、典型算法以及搜索引擎的一般评价方法。第二部分研究小世界网络的特性,小世界网络的模型,导航算法以及使用相似性方法从词法相似性、链接相似性和语义相似性三个方面分析小世界网络的特性。第三部分利用Internet的小世界特性对搜索引擎算法的改进,提高搜索引擎算法的精确度。