论文部分内容阅读
随着计算机技术、人工智能以及计算机网络技术的快速发展,计算机快速转向开放的、网络平台的、协同工作方式,在这十多年来,源于分布式人工智能(Distributed Artificial Intelligence, DAI)的智能Agent以及多Agent (Multi-Agent System, MAS)系统已经成为了人工智能研究的热点。智能Agent以及MAS的出现为分布式系统的综合、分析、实现和应用开辟了一条新的路径,进一步促进了人工智能和软件工程的发展。当前,智能Agent技术已经被广泛的应用到了电子商务、航空控制、工作流管理、交通系统以及信息检索等众多领域。而本文主要研究的是智能Agent在主题信息检索引擎中的相关问题。主题搜索引擎利用智能Agent在网络上进行有目的有选择性的爬行,相对于通用搜索引擎,它有效的减少了检索页面的数量,增加了检索页面的规整程度,并能深入剖析用户感兴趣的主题,返回大量高质量用户相关信息,因此成为了研究的热点。然而在主题搜索领域,大多数研究者们均专注于Agent的自治,即单个Agent在网络上爬行时如何进行方向选择,却忽略了多个Agent之间的协调问题。因此,本文的研究重点是将主题搜索引擎中智能Agent的社会性与智能型相结合,换句话说,本文主要研究的是主题搜索引擎中的多个Agent在网上爬行时如何共享资源及相互协调的问题。在本文中,提出一种新的网页检索方法。本方法主要基于合同网协议、蚁群思想,实现Agent的智能性、合作性,从而提高重要网页的刷新频率和网页召回率。根据合同网协议,主题搜索引擎中的智能Agent被分成了三类:Manager、Contractor以及N-Agent。Manager和Contractor是定立合同的双方,N-Agent是未定立合同的Agent。Contractor负责在网络上检索到与主题相关的网页,不承担自身的支出;Manager不仅要检索网页,还负责监控任务执行并负担Contractor的支出;N-Agent检索网页,只承担自身支出。根据蚁群算法的思想,给网页赋予两种属性:“食物信息素”和“访问信息素”。具有较高相关度的网页具有较高的“食物信息素”,经常被访问的网页具有较高的“访问信息素”。Agent通过共享“食物信息素”、“访问信息素”的信息以及对锚文本的分析,实现本文提出的新的链接选取方法。最后通过相关实验对比,进一步说明了此智能Agent的优缺点,并得出了结论:在主题搜索引擎中,Agent采用合同网协议的协商方法能够提高工作效率,通过信息共享方式选择路径能够实现召回率、准确率与重要网页刷新频率的提高,增强系统中Agent执行任务的能力。