论文部分内容阅读
本文对搜索引擎的基本框架和工作原理进行了分析和综述,并对移动Agent理论和技术进行了深入的研究,详细分析了Agent理论应用到信息采集系统的优势。本论文针对现有通用搜索引擎的不足,在对Internet信息收集处理及Agent技术的研究基础上,详细介绍了基于多Agent的专业信息采集系统的设计与实现。它使用基于多Agent的体系结构来实现信息收集过程的并行、分布式处理,较好地解决了Internet信息收集问题。本系统由分布在不同信息节点上的一组相互协作的Agent组成,包括信息采集Agent、信息分析及评价Agent、消息通讯Agent、中心控制Agent。相比于普通的分布式信息采集系统,该系统中增加了信息分析及评价Agent,它通过对所采集数据和专业词库的分析,对所搜索的网站对象给予该专业相关度的评价,以表示该网站对于该专业的价值。系统下次搜索时,可以参照该相关度,对网站进行有选择地搜索,从而有效提高信息采集系统的效率。