论文部分内容阅读
随着互联网的普及和发展,网络上的信息资源越来越丰富,它需要高效智能的工具来完成信息资源的采集.WWW上的网页抓取器,又称Robot.讨论了抓取器与文本自动分类器相结合,对用户要求领域网页的收集.抓取器找到相关链接进行抓取,而避免对非相关链接的抓取.这样可以节省硬件、网络资源和提高抓取器的效率.