Web信息检索中基于超链接的网页评估算法的研究

来源 :河海大学 | 被引量 : 2次 | 上传用户:shen648491077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网包含有海量网页,越来越多的用户通过搜索引擎寻找特定信息。Web信息检索的目的是在网页集合中找到与用户查询相关的所有网页,而网页评估算法将对这些网页进行评估后显示给用户。Google的PageRank算法通过对超链接结构的分析,有效地提高了搜索结果的排序质量。外推法(Extrapolation)是减少PageRank算法迭代次数的有效方法,而Aitken Extrapolation算法和基于特征值直接求解的算法是其典型代表。 Aitken Extrapolation算法使用Aitken变换以减少迭代次数,但Aitken变换在多数情况下无法确保算法收敛。为了弥补该算法的缺陷,本文在分析了该算法不稳定性的根源后提出了改进算法FNN-Aitken Extrapolation。与原算法相比,改进算法不频繁调用Aitken变换,而执行选择适当时机对Aitken变换调用一次的策略。理论分析和实验结果表明改进算法不仅能够弥补原算法的不稳定性而且通常比Power Method算法具有更少的迭代次数。 与Aitken Extrapolation算法相比,基于特征值求解的算法不借助Aitken变换,而通过特征值直接求解马尔可夫超链接矩阵的主特征向量,从理论上比Aitken Extrapolation算法更高效。然而基于特征值直接求解算法的迭代次数与参数d的选择密切相关,而参数d的确定目前无明显规律可寻。另一方面,Adaptive方法通过将马尔可夫超链接矩阵稀疏化以达到节省迭代时间的目的。本文将Adaptive方法分别与基于特征值直接求解算法和Aitken Extrapolation算法相结合,实验结果初步证明了这两个新算法能够缩短迭代时间。
其他文献
随着社交网络的兴起以及高清数码相机的普及,图像数据的数量正以指数级的速度增长,如何快速有效地检索和管理这些海量的图像数据成为当今计算机视觉和大数据领域的研究热点。图
网络终端技术已经在我国迅速发展起来,智能化应用服务协议是智能化网络终端和服务器上的应用系统之间进行交互的机制,研究开发智能应用服务协议具有重要的意义。本文研究了智能
面向对象软件测试是面向对象软件开发方法中不可缺少的一环,是保证软件质量,提高软件可靠性的关键。面向对象的软件测试分为四级:方法级测试、类级测试、类簇级测试和系统级测试
随着计算机和微电子技术的迅速发展,软件和芯片技术已成为IT的核心技术,这些核心技术在很大程度上决定着一个国家的信息安全和综合国力。网络计算机是一种基于网络计算机环境的
J2EE规范定义了一套标准来简化N层企业级应用的开发;J2EE服务器提供了交易处理服务、数据存取服务、Java消息服务(JMS)、安全性服务等执行环境和系统服务.J2EE的最大优点是,
数据库中的知识发现(Knowledge Di scovery in Databases,简称KDD)是数据库和人工智能领域研究的热点课题,其目的是在数据库中提取隐含的,先前未知的,潜在有用的知识。数据挖掘领
近年来,专家系统技术已广泛应用到工业、农业、军事、医学以及国民经济和社会生活的各个方面。将专家系统的研究应用于产品的可制造性分析中,利用它指导产品设计,对于提高产品质
随着互联网的迅速发展以及移动信息时代的到来,信息化正在潜移默化的改变着人们的生活,然而在改变人们生活的同时,各种信息化产物也在不断的产生海量的数据信息文件,因此也给数据
人类获取外界信息的绝大部分来自视觉,所以数字图像成为人们生活交流的重要载体之一,但是数字图像在采集、保存和传输过程中却存在很多问题。首先,传统图像在保存和传输时可能出
如今互联网已经成为了人们获取信息的重要途径之一,每天数以亿计的文本信息在互联网上被发布和传播,给用户准确获取自己需要的信息增加了难度。利用自动摘要技术为互联网上的这