论文部分内容阅读
随着Internet的迅猛发展,网上信息资源越来越丰富,网络已经成为人们获得信息的必要途径和重要手段,但是这种网上信息浩繁,具有分布、动态变化、结构复杂等特点,使得用户根本无法完全了解庞大的、瞬息万变的信息资源。在这种情况下,传统的功能固定的搜索引擎已经不能满足用户需求,人们期盼着新的,具备了智能性和用户可区分的新一代搜索引擎的出现。 本文在分析研究了国内外的搜索引擎技术的发展和未来趋势,结合人工智能技术的最新研究成果——Agent技术,提出了基于智能Agent的搜索引擎系统研究,并以此为体系架构,在Robot和用户界面方面做了大量的优化和个性化工作。采用兴趣模型,多用户协作等人工智能模型使得搜索引擎完全实现了个性化服务的特点,并提出了将对信息的“推—拉”操作融为一体的新型搜索引擎模型。其主要工作和结果如下: (1)分析和研究了传统搜索引擎的技术特点和主要的体系架构,对搜索引擎的发展历程和未来的发展方向做了较详细的探讨,从而明确指出了未来的搜索引擎发展趋势就是要引入Agent技术和个性化、专业化的发展道路。 (2)分析和研究了Agent技术的主要类别和各自的特点,结合搜索引擎的特点和实现因素的考虑,选择了Multi—Agent模型来实现搜索引擎系统。实验表明:Multi—Agent模型是容易实现并符合搜索引擎自身特点的目前技术最为实用的Agent实现模型。 (3)在Agent模型和搜索引擎功能架构的基础上,引入并改进了多个人工智能的算法和思想,结合HTML代码自身的特点,大力提高了搜索引擎系统的智能性和用户个性,其主要技术包括: a)在Robot方面,结合HTML代码的特点,在强调关键词和超链权重的基础上,提高了Robot在网页搜索和下载过程中的智能性,节省了Robot方面的开支。 b)通过标记树以及分层标记符的划分,提高了系统对于文档核心意义判定的能力。 c)采用了用户兴趣度研究,多用户兴趣协作等人工智能模型和思想,提高用户界面Agent的智能性和个性,并将信息“推——拉”理论引入到搜索引擎中,提出了一个全新的搜索引擎模型。 (4)对于以上算法和思想,考虑它们的具体实现情况,给出了具体的实现算法和图示讲解,加深对于整个研究系统的了解和熟悉。