论文部分内容阅读
随着网络容量的不断增长,信息更新的不断加快,人们想快速地检索到符合自己要求的信息变得越来越困难。信息冗余、主题参杂等问题都影响了人们检索信息的效率。在解决这些问题的过程中,利用面向主题的技术提高信息检索的效率,是人们一直在研究的热点。本论文从面向主题信息检索的角度出发,研究了在信息检索过程中利用本体、知识库以及多Agent等技术来提高人们检索信息的效率。任何信息检索的过程都包含了用户根据自己的主题对信息进行分类的思想,如何满足用户的这种主题性检索才是信息检索亟需解决的问题。除了我们通常利用各种技术、算法来提高搜索引擎的查准率和查全率以外,我们还可以借助许多其他的方法来实现这个目的。本论文就介绍了一种结合了本体、知识库及多Agent技术的面向主题的检索方法。本论文的主要工作包括三个方面的内容。(1)找出符合用户检索意图的主题。在面向主题检索的过程中,弄清楚什么是主题是首要的问题。本论文中主题的涵义是指从用户角度出发的、对信息具有语义上的鉴别能力的概念。正是出于对语义的理解和利用,我们才考虑借助本体及知识库来解决对主题的描述及划分工作。搜索引擎不但要明白用户的主题,更要能通过一定的学习以达到对主题的“自我识别”。(2)把用户的主题有效地收集起来形成知识库。知识库在解决我们的面向主题的信息检索的问题起到了很大的作用。我们依据知识库对一个主题的“定性”来判断如何对用户提供的主题进行适当的“分解”,由多Agent系统来执行分解后的信息检索过程以及检索后的结果整理过程。(3)协作式搜索,提高检索的效率。为了更好的利用现有的搜索引擎的搜索能力以及它们对网页的分析能力,我们利用多Agent系统来进行同步检索,对同一个任务进行不同的检索,再去除其中的冗余信息,将这样的结果提供给用户,给用户带来便利。本论文中最终是为了实现在手机领域的具有主题性的信息检索。为了实现这样一个过程,我们设计了一个三层结构的搜索模型,分别用来处理用户检索词、主题分析以及协作式搜索。主题分析的工作主要依靠本体知识库来完成。为了构建一个适合本系统的、简单的本体知识库,我们借助网页分类相关技术来确定我们的关键词列表,并以这些关键词为初始原语组织了一个简单的手机本体。多Agent在本论文中的应用只是传统的多Agent系统的一个很小的部分,因为在本论文中我们只是借助利用多Agent系统来实现对一个检索任务的多引擎搜索和结果的无冗余汇总。