关于现代万维网搜索算法的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:yuezhongs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今万维网规模已经快速发展到几十亿个网页和数以百亿计的超级链接,至此,要对万维网的创建和发展进行全局规划显然是不可能的,这些都对万维网上信息搜索的研究提出了挑战.互联网环境下通过超链连接起来的网页为人们日常和商务用途提供了非常丰富的信息资源,但前提是必须掌握有效的办法来理解万维网.链接结构分析在万维网的很多研究领域起着越来越重要的作用,本文将介绍由链接生成的万维网网络结构在Web信息搜索方面的应用. 本文将介绍三种利用了这种链接结构的万维网搜索方法,这三种搜索方法都是现今研究的活跃主题:PageRank[1],HITS(HypertextInducedTopicSearch)[10],随机补方法[14]. 对于PageRank算法,本文得到了若干有意义的结果.Google创始人SergeyBrin和LawrencePage把万维网搜索算法PageRank定义成某个非周期不可约马氏链的唯一平稳分布.本文第二章介绍了万维网搜索算法中使用的三个重要的马氏链-maximal不可约马氏链,minimal不可约马氏链和middle不可约马氏链.讨论比较了三个马氏链的平稳分布,收敛速度,以及平稳分布的Maclaurin级数展开.结果表明,maximal马氏链和minimal马氏链有相同的平稳分布,middle马氏链的平稳分布更客观的体现了网络的真实结构;maximal马氏链和middle马氏链有相同的收敛速度,且在阻尼因子α>1/√2时,要比minimal马氏链收敛速度快.
其他文献
期刊
生物的遗传物质随着进化而改变.相对于序列水平的点突变,越来越多的研究更加关注基因组水平的较大的变化.计算分子生物学中的基因组重排,产生了借助于反序来排列有符号排列问题
学位
期刊
期刊
本文讨论了第二类Cartan-Hartogs域与单位超球间的极值问题,其主要结果是得到了从第二类Cartan-Hartogs域到单位超球的Carathéodory极值映照,并得到了Carathéodory极值和极值
最优化是一门应用广泛、发展迅速的学科.尤其对于非线性优化问题寻找快速有效的算法一直是优化专家们研究的热门方向之一.最近人们提出了不少有效地算法如:共轭梯度算法和拟牛
Eiichi Bannai,Etsuko Bannai和Hideo Bannai对二元Hamming结合方案H(n,2)中两个壳上的紧相对2-设计进行了研究,并得到了很多重要结论.他们的结论揭示了紧相对t-设计与组合t-设计
带有控制变量的抛物方程问题是一类抛物反问题,且是非线性的,在确定解的同时还要确定某些未知控制变量,这类问题在工程和科学的许多分支中起着重要作用,本文考虑下列带控制变量抛
几年来,我公司将党风廉政建设责任制的健全与落实作为反腐倡廉工作的主线,以改革的精神抓党风,以创新的思路反腐败,抓好责任目标、监督制约、考核追究“三到位”,有效地解决