论文部分内容阅读
随着Internet的快速发展与计算机的普及,人们已经进入了网络信息时代。WWW服务器的数量都在呈指数级规律增长,大概每6个月增长一倍,虽然搜索引擎基本上解决了信息检索中“信息过载”和“资源迷向”等问题,能够为用户查找到一定的有用资源,但相对于整个因特网来说是极不全面的,其在资源覆盖度、检索精度、检索结果可视化、可维护等诸多方面,效果远远不能够令人满意。 本论文首先介绍了现有搜索引擎的研究现状,指出其中不足,并分析了Agent的技术特性,阐述其应用的先进性和可行性。接着提出一个新的智能搜索引擎框架结构,包括专家Agent、信息检索Agent、信息过滤Agent、查询扩展Agent、用户模型Agent等模块,各部分协同工作,形成了一个有机整体。由于在该检索系统中,搜索和过滤两个环节尤为重要,故在后续章节中详细阐述了信息检索Agent及其检索模型、信息过滤Agent的功能与算法。本文在比照其他几种常用检索模型的基础上,提出了SVS检索模型,既克服了向量空间算法的局限性,又体现出隐性语义索引模型的优势。另外人性化的人机界面Agent提供智能的查询接口,当从普通搜索引擎查询回来的网址还是不够时,系统启动自己的网络搜索引擎,从现有的网址出发,利用有限区域的深度广度优先算法进行搜索,从而保证信息的查全率。信息过滤Agent突破传统信息过滤的单一性,在绑定“属性+内容+结构”三种查询过滤方法的基础上,再进行贝叶斯改进分类,然后利用ID3学习算法获取最后结果给用户,保证了信息的查准率。最后介绍了用户Agent以及如何创建、使用和维护用户档案和用户信息库。 本文将智能Agent技术应用于信息检索中,可以十分灵活地提供多种智能化的信息处理手段,将有利于开拓Internet网络资源的信息服务。