利用超链接信息改进网页爬行器的搜索策略

来源 :吉林大学学报(信息科学版) | 被引量 : 0次 | 上传用户：epippo

【摘要】

：

网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的.

【作者】

：

赫枫龄左万利

【机构】

：

吉林大学计算机科学与技术学院

【出处】

：

吉林大学学报(信息科学版)

【发表日期】

：

2005年1期

【关键词】

：

爬行器网络搜索引擎宽度优先搜索超链接 crawler internet search engine breadth-first search hyp

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的.爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高.为此,给出了利用超链接信息改进网页爬行器搜索策略的算法.该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行.实验表明,利用该算法爬行得到的网页与某一特定主题

其他文献

仪表飞行仿真系统的实现

为缩短训练飞行员的周期,提高训练飞行员的质量,设计并实现了一种仪表飞行仿真系统.对系统中使用的各种技术进行了深入的研究,包括应用系数构造法实现空气动力学模型,采用基

期刊

飞行仿真PID控制系数构造flight simulation proportional integral derivative （PID） contro

基于统计矢量矩阵的用户参数描述与管理

针对目前没有公认的模型可靠地描述用户参数的问题，提出了在MPEG-21（Moving Picture Experts Group 21）下基于统计矢量矩阵和交互式管理相结合的方法，并通过数字项调节和代理的协

期刊

多媒体框架标准用户参数统计矢量矩阵multimedia framework standard user preferences statistical

利用超链接信息改进网页爬行器的搜索策略

与本文相关的学术论文