基于Web信息检索的链接分析算法研究

来源 :东北师范大学 | 被引量 : 1次 | 上传用户：lah822900

【摘要】

：

随着Internet技术的高速发展,Web已经成为人们获取信息的一个重要途径,由于Web上的文本信息日益增长,如何有效地检索用户所需的信息成为一个非常重要的研究课题。万维网WWW(W

【作者】

：

邓凯英

【机构】

：

东北师范大学

【出处】

：

东北师范大学

【发表日期】

：

2008年01期

【关键词】

：

Web信息检索 PageRank 超链接分析主特征向量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet技术的高速发展,Web已经成为人们获取信息的一个重要途径,由于Web上的文本信息日益增长,如何有效地检索用户所需的信息成为一个非常重要的研究课题。万维网WWW(World Wide Web)是一个巨大的、分布全球的信息服务中心,正在以飞快的速度扩展,这就对传统信息检索技术提出了新的挑战。在传统的信息检索技术没有突破性进展的现状下,从Web数据本身的特点出发,充分挖掘Web上最充分的超链接资源,通过超链接进行搜索,建立有效的Web信息检索模型,从而找到我们需要的信息。因此,链接结构分析在万维网的很多研究领域起着越来越重要的作用,本文将介绍链接结构在Web信息检索中的应用。近年来,许多研究者发现WWW上超链结构是个非常丰富和重要的资源,如果能够充分利用这些资源,可以极大地提高检索结果的质量。基于这种超链分析的思想,Sergey Brin和Lawrence Page在1998年提出了PageRank算法。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位,而收敛算法的好坏尤其重要,它直接决定了得到最终PageRank向量的时空开销,一个好的收敛算法可以使系统在较小的时空开销下得到最终向量值,从而使整个搜索的效率得到提高。在当前情况下,PageRank要处理的矩阵是巨大的,传统的矩阵理论不能直接应用于PageRank的计算。因此迫切需要利用PageRank转移矩阵特征值的特殊性,找到一个比较高效的计算方法来提高迭代法的收敛速度,以便提高PageRank的计算效率。本文首先分析由链接生成的万维网网络结构在Web信息检索中的应用,然后介绍PageRank算法的模型建立与主要性质。随后,在现有PageRank计算方法的研究基础上,作者推导加速PageRank计算的一般性公式,设计产生满足Web链接结构特征的高维随机矩阵的算法。本文提出General Extrapolation和Acceleration Extrapolation两种有效的加速收敛方法。最后,我们分别在高维随机矩阵数据和四个数据集上进行数值实验,实验结果证实加速PageRank计算的理论分析和算法的有效性。从实验结果可以看出,计算速度得到明显加快。

其他文献

思则凯在预防早期中重度卵巢过度刺激综合征的应用

目的评价思则凯在预防早期中重度卵巢过度刺激综合征(OHSS)高风险妇女中的应用价值.方法将263例OHSS高风险行全胚冷冻的患者随机分为对照组和思则凯组:对照组(n=148)自取卵

期刊

思则凯雌激素中重度卵巢过度刺激综合征

周期性微结构光子材料中光波的非线性传输研究

光子代替电子作为信息的载体是人们的一个共识，因为光子技术具有高传输速度、高密度及高容错性等优点。然而，由于光子不像电子一样易于控制，光子器件远不如电子器件成熟，致使光信

学位

周期性微结构光子材料光波非线性传输光学格子

多级Ad Hoc网络与蜂窝网络融合的仿真研究

随着移动互联网的迅速发展,人们对无线通信的需求越来越高。带有固定基础设施的蜂窝网络如果遭到地震,战争等灾害的破坏时,网络通讯就会终断。Ad Hoc网络由于具有无固定基础

学位

多级Ad Hoc网络AODV3G网络网络融合VPN

少教多学院通向有效课堂的重要途径

新课改以来，虽然教师的教学理念发生了较大的改观，但教师主导课堂、学生被动学习的局面没有根本改变。针对此现状，本文结合钱梦龙先生的“三主”导学理念，提出少教多学，从学生学习

期刊

少教多学学生主体有效课堂

A Critical Review of A Self System Perspective on Young Adolescents'Motivation to Learn English

Motivation of leing English as a second language has been being paid much attention for many years. This critical re?view focuses on a research article, titled

期刊

self system perspectivemotivationESL

定量血流分数指导冠状动脉外科血运重建的研究

目的·分析应用定量血流分数(quantitative lfow ratio,QFR)技术指导冠状动脉外科血运重建策略的初步临床结果,探索其可行性与安全性.方法·纳入2018年1月—2019年6月上海交

期刊

心脏外科手术冠状动脉旁路血管移植术心肌血流储备分数定量血流分数围术期临床结果

基于连续时间马尔可夫链的无线传感器网络生存性评估

随着传感器技术的快速发展，传感器网络在各个领域的应用也越来越广泛。由于传感器通常部署在无人值守、条件恶劣的环境中，导致传感器网络非常容易遭到破坏。在这种情况下，评估网

学位

无线传感器网络连续时间马尔可夫链单节点行为组合生存性评估网络连通概率

慢性牙周炎在腹膜透析患者中的发病状况及其与患者透析充分性的相关性研究

目的·基于单中心人群分析腹膜透析患者慢性牙周炎(chronic periodontitis,CP)的发病状况,探讨CP严重程度与腹膜透析充分性指标的相关性.方法·选取2018年12月—2019年12月于

期刊

腹膜透析慢性牙周炎透析充分性贫血

面向查询的多文档自动文摘研究

Internet的飞速发展为用户提供了丰富的信息资源,同时也促进了信息处理技术的崛起。通过信息处理技术,可以帮助人们更加有效地组织、总结和分析网络上的各种资源。而这当中,

学位

面向查询的多文档自动文摘多文档自动文摘多特征融合的文摘句选择方法MMR技术

基于混合式P2P模型的消息中间件的设计与实现

如同硬件系统需要一条系统总线连接各个部件一样,分布式系统也需要一条软件总线连接各个节点,为分布式系统提供可靠的通信服务。消息中间件就是分布式系统中的软件总线,为分

学位

消息中间件混合式P2P线程池连接池发布/订阅

基于Web信息检索的链接分析算法研究

与本文相关的学术论文