基于多Agent的个性化信息检索系统研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:annybill1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展和普及,搜索引擎已经发展的比较成熟,利用搜索引擎在网络上搜索信息成为越来越多用户的选择。但是对于一般用户而言,面对着呈指数级增加的网络信息,想要快速、准确地检索到自己所需的信息越来越困难。针对这一现状,许多研究人员提出了个性化的主动信息服务方式,即将用户感兴趣的、需要的信息主动的推送给用户的服务方式。智能Agent技术在这种服务方式中,发挥了重要作用。  本文在系统地研究了智能化信息检索系统中所涉及的关键技术基础上,对智能化信息检索Agent框架进行了改进。用三个Agent模块来分别实现用户兴趣建模、信息搜索、信息过滤等功能,改进后的系统称为基于多Agent的个性化信息检索系统(Personalized Information Retrieval based on Multi-Agent)。系统通过用户在网络上的浏览行为,自主学习用户兴趣并且不断更新,帮助用户选择最适合的网络资源。  用户Agent是系统根据用户对信息需求的表达和信息反馈得到和训练的,用户兴趣模型通过用户Agent来表示、建立和更新。在传统的二元组(兴趣词条,兴趣权重)表示兴趣的基础上引入了词条新鲜度的概念,即在计算兴趣权重时,除了考虑兴趣词条在文档中出现的次数,还要考虑兴趣词条出现在文档中不同的位置(代表兴趣词条的重要度),以及文档在超链关系中所体现的文档不同重要度等因素。在传统的词频法中引入了新鲜度概念之后,有效的降低了将出现频率高而意义并不大的词条作为兴趣词条的机率。改进后的词频法,由三元组来衡量用户的兴趣(兴趣词条、兴趣权重、词条新鲜度),这样得到的兴趣词条更加可靠。用户兴趣模型的建立和更新通过基于记忆观察的学习机制、接受反馈的机器学习机制、ID3算法的归纳学习机制三种机器学习方法[3]。  通过查询代理将信息检索Agent与网络搜索引擎相连接,不仅实现了元搜索,也可以使用自主搜索工具——Robot在网络上的自主搜索以防查询代理返回的网址较少或不满足用户的要求,并且减少了搜索范围。搜索算法是从查询代理返回的网址出发进行搜索的,所有搜索速度得到提高。此外,用Robot搜索网络的算法当深度受限时能动态的调整深度,该特点可以保证在加快搜索速度的同时,保证搜索质量。信息过滤Agent采用向量空间法,同时以用户的历史信息资源分析用户喜好,进行信息过滤。在系统中三个Agent模块相互协作,从而实现检索系统的个性化、主动性和智能化。
其他文献
大量现实应用包括生物信息分析、化学制药、社会网络聚类等需要图挖掘技术的支撑,其中基于图中的频繁模式挖掘一直是一项核心研究,也引起了学术界和工业界广泛的高度重视。随
随着网络技术的发展,网络功能日益强大,业务的综合性更为突出。网络通信涉及到多用户参与,需要耗费大量的网络资源,由于不同网络业务对各种服务质量(Quality of Service,QoS)有着
随着数字技术和因特网的发展,越来越多的图像和视频以数字内容的方式存储。存储成本的降低和数字内容的增加,如何有效地管理和检索这些数字内容成为一个极具挑战性的问题。既
内网信息安全的实质是对内网信息流和数据流进行全生命周期的有效管理,确保信息的保密性、可用性、完整性、可控性和不可否认性。现有的内网信息安全技术大多依赖于内部网络
近年来,国内外学者对不确定数据流的聚类问题进行了大量的研究,但仍有不少问题尚待解决。大多数不确定数据流聚类算法不能在线得到精确的聚类结果;现有算法采用固定划分网格
随着科技水平的发展和社会信息化程度的提高,生物特征识别技术已经逐渐深入社会的各个领域,成为人们生产、生活中不可或缺的环节。自动指纹识别,作为生物特征识别中的研究最
21世纪是一个以网络为核心的信息时代,全球数字化、网络化、信息化发展日益凸显。目前Peer-to-Peer网络因在分享资源方面的独特优势而被广泛应用,但由于自身的分布式和自组织的
Android作为当前最流行的移动设备开发平台,从推出开始就受到了开发者与用户的一致好评与推崇。而随着近一段时间大家对于应用程序安全、个人隐私关注度的逐步提高,Android系统
在当今Web2.0的环境下,社会化媒体从最近几年的时间中得到长足的发展,从国外的多种多样的基于社会网络的媒体内容分享网站的兴起,到国内类似网站的成长,社会化媒体,已经深深
计算机视觉的目标在于使得计算机可以像人类一样具有感知与处理外界视觉信息的能力。摄像机作为计算机视觉获取外界视觉信息的基本、甚至可以说唯一手段,在计算机视觉研究中