论文部分内容阅读
随着Internet的发展和普及,搜索引擎已经发展的比较成熟,利用搜索引擎在网络上搜索信息成为越来越多用户的选择。但是对于一般用户而言,面对着呈指数级增加的网络信息,想要快速、准确地检索到自己所需的信息越来越困难。针对这一现状,许多研究人员提出了个性化的主动信息服务方式,即将用户感兴趣的、需要的信息主动的推送给用户的服务方式。智能Agent技术在这种服务方式中,发挥了重要作用。 本文在系统地研究了智能化信息检索系统中所涉及的关键技术基础上,对智能化信息检索Agent框架进行了改进。用三个Agent模块来分别实现用户兴趣建模、信息搜索、信息过滤等功能,改进后的系统称为基于多Agent的个性化信息检索系统(Personalized Information Retrieval based on Multi-Agent)。系统通过用户在网络上的浏览行为,自主学习用户兴趣并且不断更新,帮助用户选择最适合的网络资源。 用户Agent是系统根据用户对信息需求的表达和信息反馈得到和训练的,用户兴趣模型通过用户Agent来表示、建立和更新。在传统的二元组(兴趣词条,兴趣权重)表示兴趣的基础上引入了词条新鲜度的概念,即在计算兴趣权重时,除了考虑兴趣词条在文档中出现的次数,还要考虑兴趣词条出现在文档中不同的位置(代表兴趣词条的重要度),以及文档在超链关系中所体现的文档不同重要度等因素。在传统的词频法中引入了新鲜度概念之后,有效的降低了将出现频率高而意义并不大的词条作为兴趣词条的机率。改进后的词频法,由三元组来衡量用户的兴趣(兴趣词条、兴趣权重、词条新鲜度),这样得到的兴趣词条更加可靠。用户兴趣模型的建立和更新通过基于记忆观察的学习机制、接受反馈的机器学习机制、ID3算法的归纳学习机制三种机器学习方法[3]。 通过查询代理将信息检索Agent与网络搜索引擎相连接,不仅实现了元搜索,也可以使用自主搜索工具——Robot在网络上的自主搜索以防查询代理返回的网址较少或不满足用户的要求,并且减少了搜索范围。搜索算法是从查询代理返回的网址出发进行搜索的,所有搜索速度得到提高。此外,用Robot搜索网络的算法当深度受限时能动态的调整深度,该特点可以保证在加快搜索速度的同时,保证搜索质量。信息过滤Agent采用向量空间法,同时以用户的历史信息资源分析用户喜好,进行信息过滤。在系统中三个Agent模块相互协作,从而实现检索系统的个性化、主动性和智能化。