利用超链接信息改进网页爬行器的搜索策略

来源 :吉林大学学报(信息科学版) | 被引量 : 0次 | 上传用户:epippo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的.爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高.为此,给出了利用超链接信息改进网页爬行器搜索策略的算法.该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行.实验表明,利用该算法爬行得到的网页与某一特定主题
其他文献
为缩短训练飞行员的周期,提高训练飞行员的质量,设计并实现了一种仪表飞行仿真系统.对系统中使用的各种技术进行了深入的研究,包括应用系数构造法实现空气动力学模型,采用基
针对目前没有公认的模型可靠地描述用户参数的问题,提出了在MPEG-21(Moving Picture Experts Group 21)下基于统计矢量矩阵和交互式管理相结合的方法,并通过数字项调节和代理的协