论文部分内容阅读
当今万维网规模已经快速发展到几十亿个网页和数以百亿计的超级链接,至此,要对万维网的创建和发展进行全局规划显然是不可能的,这些都对万维网上信息搜索的研究提出了挑战.互联网环境下通过超链连接起来的网页为人们日常和商务用途提供了非常丰富的信息资源,但前提是必须掌握有效的办法来理解万维网.链接结构分析在万维网的很多研究领域起着越来越重要的作用,本文将介绍由链接生成的万维网网络结构在Web信息搜索方面的应用.
本文将介绍三种利用了这种链接结构的万维网搜索方法,这三种搜索方法都是现今研究的活跃主题:PageRank[1],HITS(HypertextInducedTopicSearch)[10],随机补方法[14].
对于PageRank算法,本文得到了若干有意义的结果.Google创始人SergeyBrin和LawrencePage把万维网搜索算法PageRank定义成某个非周期不可约马氏链的唯一平稳分布.本文第二章介绍了万维网搜索算法中使用的三个重要的马氏链-maximal不可约马氏链,minimal不可约马氏链和middle不可约马氏链.讨论比较了三个马氏链的平稳分布,收敛速度,以及平稳分布的Maclaurin级数展开.结果表明,maximal马氏链和minimal马氏链有相同的平稳分布,middle马氏链的平稳分布更客观的体现了网络的真实结构;maximal马氏链和middle马氏链有相同的收敛速度,且在阻尼因子α>1/√2时,要比minimal马氏链收敛速度快.